Databricksとは

Databricksとは

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Databricks を Zoho 分析にシームレスに接続し、分析の各段階で直感的な可視化と AI 搭載の分析を活用して、ビッグデータを実用的なインサイトへと変換できます。堅牢なデータパイプラインで複雑なデータフローを自動化し、インポートをスケジュールして、ほぼリアルタイムで更新できます。

接続詳細を設定する

  1. [データのインポート > データベース & データレイク]をクリックします。
  2. 一覧に表示されるデータソースから Databricks を選択します。
  3. データが保存または利用可能な場所に応じて、ホストサーバーの種類(クラウドサーバー または ローカルサーバー)を選択します。

クラウドサーバー

  1. クラウドサービスプロバイダーを選択します。
    1. Databricks:エンドポイントを指定します。
    2. Azure:サーバー名を指定します。
  2. HTTP パスを指定します。
  3. ユーザー名パスワードを指定します。
  4. カタログ名データベース名を指定します。

  5. データを取得するためにデータベースへどのように接続するかを選択します。
    1. IP アドレスを使用して直接接続:この方法を使用するには、Zoho 分析の IP アドレスを許可リストに追加する必要があります。
    2. エージェント経由で接続:Zoho Databridge は、非公開ネットワーク内にホストされているデータの取得を支援するユーティリティツールです。Zoho Databridge の最新バージョンがインストールされていることを確認してください。

  6. データ転送プロセスを暗号化して保護するために、[SSL を使用] チェックボックスは初期設定で有効になっています。
  7. データ転送を保護するために、[SSL トンネリングを使用] チェックボックスを選択します。
  8. SSH ホスト名、SSH ポート、SSH ユーザー名、SSH パスワードを指定します。

  9. [次へ] をクリックします。

ローカルサーバー

  1. データベースホスト名HTTP パスを指定します。
  2. ユーザー名パスワードを指定します。
  3. カタログ名データベースホスト名を指定します。
  4. データベースにアクセスできるDatabridge を選択します。詳細は Zoho Databridge の記事を参照してください。
  5. SSH ホスト名、SSH ポート、SSH ユーザー名、SSH パスワードを指定します。

  6. [次へ]をクリックします。

インポートするデータを選択する

接続詳細を設定したら、Databricks からどのデータをインポートするかを決定します。Zoho 分析では、単一テーブル複数テーブルカスタムクエリーなど、さまざまなデータ構造や分析ニーズに対応したインポート設定を利用できます。

単一テーブル

  1. [インポート元] セクションで [単一テーブル] を選択します。
  2. [テーブルを選択] ドロップダウンから、インポートするテーブルを選択します。
  3. [次へ] をクリックして続行します。

  4. [インポート設定とプレビュー]ウィザードが開きます。
    • 必要に応じて、ワークスペース名テーブル名を編集し、説明を追加できます。
    • [データプレビュー] セクションには、データの先頭数行が表示されます。ここで列名やデータ型を確認できます。
    • インポート対象から列を除外するには、列ヘッダー横のチェックボックスをオフにします。
  5. [インポート時のエラー] セクションでは、データインポート中にエラーが発生した場合の処理方法を指定できます。設定可能な項目は次のとおりです。
    • 列の値を空にする(初期設定): インポート時に問題が発生した該当列の値を空にします。
    • 該当行をスキップする: インポート中にエラーが発生した行をスキップします。
    • データをインポートしない: インポート中にエラーが発生した場合、インポート処理全体を中止します。

  6. [作成] をクリックします。データのインポートが開始され、インポートのスケジュールを設定することもできます。

複数テーブル

  1. [インポート元] セクションで [複数テーブル] を選択します。
  2. インポートするテーブルを選択します。
  3. [次へ] をクリックして続行します。

  4. 表示されるインポート設定ページで、Zoho 分析内で作成するワークスペース名を指定します。ワークスペースの説明を入力することもできます。
  5. テーブル名を編集するには、マウスオーバー時に表示される編集アイコンをクリックします。
  6. [インポート時のエラー] セクションで、インポート中に発生したエラーの処理方法を指定します。

  7. [作成] をクリックします。データのインポートが開始され、インポートのスケジュールを設定することもできます。

カスタムクエリー

  1. [カスタムクエリー] オプションを選択し、テキストエリアに SQL SELECT クエリーを入力します。
  2. [次へ] をクリックして続行します。以降の手順は、単一テーブルからデータをインポートする場合と同様です。

データインポートのスケジュール

データ更新

効果的な分析には、データの鮮度が重要です。Zoho 分析では、各スケジュールでどのデータを取得するかを設定できます。

  • すべてのデータをインポート: このオプションでは、各スケジュールで全データをインポートします。詳細は、インポートのスケジュールの記事を参照してください。
  • 増分更新: このオプションでは、Zoho 分析に新規および更新済みデータのみをインポートします。トランザクションデータが頻繁に更新されるデータベースに適しています。詳細は、増分取得の記事を参照してください。

以下の手順に従って、インポートの同期設定(データ更新設定)を行います。

  1. データインポートを開始したら、[このインポートをスケジュール] をクリックします。
  2. [各スケジュールで取得するデータ] ドロップダウンを選択します。すべてのデータをインポートするか、新規追加または更新済みデータのみを増分取得するかを選択できます。

  3. [データをどのようにインポートしますか?] を選択します。
  4. [クラウドデータベースに追加された新しい列を Zoho 分析のテーブルに自動的に含める] を選択すると、以降のインポートで新しく作成された列からのデータもインポートされます。
  5. [次へ] をクリックします。

データ同期頻度

Zoho 分析では柔軟な同期スケジュールを提供しており、常に最新のデータで分析を行うことができます。

  1. [スケジュール設定] ペインで、データを同期する間隔を選択します。次のいずれかの間隔でデータを同期できます。
    • 毎 ‘N’ 時間
    • 毎日
    • 毎週 1 回(スタンダードプラン以上)
    • 毎月 1 回(スタンダードプラン以上)
  2. [スケジュールしない] を選択すると、インポートは 1 回のみ、つまりインポート実行時にのみ行われます。
  3. インポートエラーが継続して発生する場合、メールで通知を受け取るように設定できます。通知を受け取るには、[次の頻度で通知] ドロップダウンから通知間隔を選択します。また、アカウント管理者、すべてのワークスペース管理者、すべての組織管理者、またはカスタムユーザーを通知先として選択できます。
  4. アカウント管理者、すべてのワークスペース管理者、すべての組織管理者、または任意のカスタムユーザーを通知先として選択することもできます。
  5. [定期的に取得] トグルボタンを有効にすると、データのフル取得を定期的に実行できます。利用可能な頻度は、選択した間隔に基づいて決まります。
  6. 必要な間隔を選択し、[保存] をクリックします。

異なるテーブルを異なる同期間隔で同期する方法については、複数同期スケジュール間隔セクションを参照してください。

インポートのロールバック

インポートのロールバックは、直近のデータインポートを前のバージョンに戻す機能です。管理者権限を持つユーザーと、テーブルの作成権限を持つカスタム役割のユーザーがこの操作を実行できます。ロールバックにより、業務を中断することなくデータの誤りを修正でき、データ損失も最小限に抑えられます。複数のユーザーがデータへアクセスし変更を行う共同作業環境で特に有用です。

メモ:

  • データは、インポートから 4 時間以内であれば前の状態に戻すことができます。
  • 削除された列は、インポートのロールバック時にも復元されません。
    新しい列の追加、数式の作成、列の書式設定、ルックアップの定義などの処理は、インポートのロールバック後も保持されます。

データインポートを前のバージョンに戻すには、次の手順に従います。

  1. ロールバックしたいデータテーブルにアクセスします。
  2. [データのインポート] > [最終インポートの詳細] をクリックします。

  3. [ロールバック] をクリックして、前のインスタンスに戻します。
  4. インポートのロールバックが開始され、操作を実行した管理者の詳細と実行時刻とともにステータスが表示されます。

ライブ接続

ライブ接続を使用すると、データソースに対して直接リアルタイムに接続でき、常に最新のデータを用いて分析を行えます。この方法では、データは Zoho 分析アプリケーション内にインポートまたは保存されません。詳細は、ライブ接続の記事を参照してください。

データソースの管理

[データソース]タブは、ワークスペース内のすべてのデータソースの接続設定を一元管理するハブです。データ同期のステータスを把握し、同期が失敗した場合には通知を受け取ることもできます。管理者権限を持つユーザーは、[データソース]タブにアクセスして、必要に応じて設定を変更できます。

接続の編集

管理者が再認証を行い、認証情報や構成設定などの接続詳細を、既存のデータフローを中断することなく更新できるようにします。


同期設定

データ同期の頻度(例:毎日から毎時間の同期への変更)を、現在の分析ニーズに応じて管理・変更できます。同期が失敗した場合に、どのユーザーに通知するかを指定することも可能です。また、新しく追加されたデータのみをインポートする定期的な取得設定をテーブルごとに管理できます。詳細は、スケジュールインポートのセクションを参照してください。


複数の同期間隔を設定する

Zoho 分析では、1つの接続内のテーブルごとに複数の同期スケジュールを設定できます。つまり、テーブルごとに異なるタイミングで同期することが可能です。詳細は、複数同期スケジュールの記事を参照してください。

メモ:1つのデータベースには、最大5つまで同期スケジュールを設定できます。

監査履歴

監査ログは、セキュリティの維持や問題のトラブルシューティングに不可欠です。ユーザー操作およびシステム処理の詳細な記録を提供し、操作が行われた日時や、その操作を実行した管理者に関する情報を確認できます。監査ログは、ワークスペース内の各データソースごとに保持されます。


Zoho 分析で記録されるユーザー操作およびシステム処理は次のとおりです。

種類 操作 説明
ユーザー操作 データソースの作成 アプリケーションとの接続を設定した管理者の詳細を表示します。
テーブルの作成 ワークスペースに追加された新しいテーブルの詳細を表示します。
データソースからのテーブル削除 削除されたテーブルの詳細を表示します。
設定の編集 再認証、SSH の有効化/無効化など、構成の変更内容を表示します。
インポート設定 データ取得設定の変更内容を表示します。
同期設定 データ同期設定の変更内容を表示します。
テーブル単位の今すぐ同期 [今すぐ同期]オプションを使用した際に、どのデータが取得されたかの詳細を表示します。
システム活動 スケジュールインポート 設定された間隔でデータを取得します。

監査履歴内の任意の操作を選択すると、その操作に関する詳細情報が表示されます。

同期履歴

データ同期の活動履歴を詳細に確認でき、管理者は各データ同期のステータスを簡単に追跡できます。同期処理は、ひと目で判別できるよう色分けされています。正常に完了したデータ同期は緑色で表示され、問題なく完了したことを示します。失敗したデータ同期は赤色で表示され、失敗の理由と、実施すべき対応内容が併せて示されます。

テーブル同期設定の管理

Zoho 分析では、全件取得や新規データのみをインポートする増分取得など、柔軟なデータ取得設定を提供しています。テーブルごとに異なるデータ取得設定を持たせることができます。データベースからインポートされたすべてのテーブルが、テーブル名データソース側のテーブル名、各同期で取得されるデータ最終取得時刻、および同期ステータスとともに一覧表示されます。

  1. 設定を変更したいテーブル上にマウスカーソルを合わせます。
    • [今すぐ同期]アイコンをクリックすると、データソース側のデータベースで最近行われた変更を反映できます。データは、そのテーブルに設定されているデータ取得方法に基づいてインポートされます。新規データのみをインポートするよう設定されているテーブルでは、全件データ取得を実行することもできます。

       
    • [編集]アイコンをクリックして、そのテーブルの同期設定を変更します。各データ同期スケジュールで、データソースからすべてのデータを取得するか、新規データのみを取得するかを選択できます。

  2. [削除]アイコンをクリックしてテーブルを削除します。これにより、データソース側のテーブルと Zoho 分析間のデータ同期のみが停止されます。そのテーブルに定義されているルックアップやリレーションシップ、およびそのテーブルを基に作成されたレポートは、すべて保持されます。
  3. [情報]アイコンをクリックして、インポート詳細を表示します。正常にインポートされたデータと、インポート時にエラーが発生したデータの概要を確認できます。

同期失敗の解決

提供された認証情報が無効または期限切れの場合や、データ型が不一致の場合などに、データ同期が失敗することがあります。Zoho 分析は、ワークスペース管理者にメールを送信するとともに、失敗の理由と問題解決のために必要な対応内容を記載したアプリ内通知も送信します。同期失敗を解決するには、[データソース]タブにアクセスしてください。詳細は、設定の編集セクションを参照してください。

データブレンディング

ファイルフィードクラウドストレージデータベース業務アプリケーションなど、さまざまなデータソースからのデータを組み合わせて、詳細な分析を行えます。既存のワークスペースにデータをインポートする際、Zoho 分析は同じデータ型の列を自動的に識別し、ルックアップの候補を提示します。クエリテーブルを使用すると、ワークスペース内の複数テーブルからデータを結合できます。クエリテーブルを使用してデータをインポートしてください。

既存のワークスペースにデータをインポートするには、サイドナビゲーションパネルの[作成]アイコンをクリックし、ドロップダウンメニューから[新規テーブル/データのインポート]を選択します。その後の手順は、このセクションで説明した手順と同様です。

既存テーブルへのデータインポート

  1. [インポート] > [このテーブルにデータをインポート]をクリックします。
  2. インポート先のテーブルを選択します。

  3. 既存テーブルへのデータのインポート方法と、インポートエラーの処理方法を選択します。
  4. [インポート]をクリックします。