Google BigQueryからデータをインポートする

Google BigQueryからデータをインポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




Zoho DataPrepは、Google BigQueryからのデータインポートに対応しています。BigQueryは、組織のデータ管理を支援するフルマネージド型のエンタープライズデータ倉庫です。このコネクターを利用することで、ETLワークフローの効率化、スムーズなデータ移動、Google BigQueryとZoho DataPrep間のデータ統合を簡単に実現できます。

前提条件

データをGoogle BigQueryから取得するには、プロジェクトIDDataset場所の詳細が必須です。

  1. Googleアカウントにログインします。
  2. インポートしたいデータセットが含まれているプロジェクトを選択します。プロジェクトIDは、BigQueryコンソール左上のプロジェクトセレクターに表示され、ここで異なるプロジェクトの選択や切り替えが可能です。
  3. 任意のテーブル名をクリックして詳細を表示します。Dataset infoパネルにDataset場所の詳細が表示されます。詳細についてはBigQuery locations記事をご参照ください。
Google BigQuery への接続を行う前に、以下の条件が満たされていることを確認してください。

1. Zoho DataPrep サーバーにデータベースの読み取り権限を付与してください。

2. データベースへの正しいログイン認証情報をお持ちであることを確認してください。ベストプラクティスとして、対象データベースにZoho DataPrepサーバーから、該当するデータベースのネイティブな管理ソフトウェアを利用して接続できるかお試しください。

Google BigQuery からデータをインポートする方法

1. パイプラインを作成 または既存のパイプラインを ホーム ページ、 パイプライン タブ、または ワークスペース タブから開き、 データを追加 オプションをクリックします。また、 データをインポート オプションを ワークスペース タブ内でクリックしてデータをインポートできます。

情報: パイプラインビルダーの上部にあるデータをインポートアイコンをクリックして、複数のソースからパイプラインへデータを取り込むこともできます。




2. 左側のペインからクラウドデータベースカテゴリを選択し、Google BigQueryをクリックします。また、検索ボックスで直接オプションを検索することもできます。



3. 保存済みのデータ外部連携からアカウントを選択するか、新規追加オプションを使って新しいアカウントを追加します。



4. 新しい接続を追加するには、プロジェクトIDを入力し、Googleでサインインボタンをクリックしてください。

メモ: プロジェクトIDはGoogle Cloudコンソールで確認できます。Google BigQueryでは、認証されたIDに基づきリソースへのアクセスが許可されます。

5. Googleアカウントでサインインした後、続けるをクリックして、Zoho DataPrepが初めてGoogle BigQueryプロジェクトのデータへアクセスすることを許可します。



メモ: 接続設定は安全に保存され、今後Google BigQueryプロジェクトからデータをインポートする際に使用されます。

6. インポートしたいテーブルを選択します。インポートするをクリックしてください。



7. SQLクエリを使用してデータを選択し、インポートすることも可能です。

Warningインクリメンタルフェッチオプションは、データベースからクエリを使用してインポートする場合は利用できません。こちらをクリックして、クラウドデータベースからのインクリメンタルフェッチについて詳細をご確認いただけます。




8. インポートするをクリックして、Google BigQueryプロジェクトからデータのインポートを開始します。

9. データのインポートが完了すると、 Pipeline builder ページが開き、適用中の変換でETLパイプラインの作成を開始できます。また、ステージを右クリックし、 Prepare data オプションを選択すると、 DataPrep Studio ページでさまざまな変換を利用してデータを準備できます。 こちらをクリック すると、変換の詳細をご覧いただけます。



10. データフローの作成と各ステージで必要な変換を適用し終えたら、ステージを右クリックして宛先を追加してデータフローを完成させます。
メモ: ETLパイプラインに宛先を追加した後は、まず手動実行でパイプラインの動作を確認してください。手動実行が正常に動作することを確認できたら、その後でスケジュールを設定してパイプラインやデータ移動を自動化できます。各種実行方法についてはこちらをご参照ください。
スケジュール、バックフィル、手動更新、Webhook、またはZoho Flowを設定する際は、すべてのソースでインポート設定を行う必要があります。インポート設定を行わない場合、実行内容は保存できません。インポート設定の方法についてはこちらをクリックして詳細をご確認ください。

11. ランの設定後、パイプラインジョブが実行時に作成されます。ジョブのステータスは、Job概要で詳細情報とともに表示できます。こちらをクリックしてJob概要の詳細をご覧ください。

Google BigQuery接続を編集する方法  

DataPrepでは、外部連携の認証情報を保存することで、データデータ元や送信先への接続時に毎回認証情報を入力する手間を省けます。保存済みのデータ接続は、編集 connectionオプションを使って、いつでも編集や新しいパラメーターや認証情報への更新が可能です。
 

1. 左側のペインでSaved 外部連携をクリックし、選択する your data データ元ボックスから新規データセット作成時に選択します。


 

2. 保存済みの外部連携をデータインポート画面の右側で管理できます。(省略記号)アイコンをクリックすると、連携の共有、編集、概要の表示、または削除が行えます。

 

3. 編集連携オプションをクリックします。保存済み連携のプロジェクトIDを更新し、更新するをクリックしてください。



よくある質問

Zoho DataPrep は、定期的に有効期限が切れるアクセストークンを使用して Google BigQuery に接続しています。更新用トークンを使って新しいアクセストークンを自動取得するため、再度サインインせずに接続を有効な状態に保てます。ただし、Google Cloud の設定や管理者によるトークン有効期限ポリシーにより、更新用トークンが期限切れ・取り消し・無効となる場合があります。その場合、トークンの自動更新ができず、接続エラーが発生して既存連携の再認証が必要となります。

このようなエラーを防ぐには、Zoho DataPrep を信頼済みアプリとして追加してください。これにより、トークンの頻繁な取り消しを防げます。詳細はこちらをご参照ください。

Notes
メモ:これらのセキュリティポリシーやトークンの有効期限、取り消しは、Zoho DataPrep ではなく Google Cloud 管理者によって管理されています。
 

関連情報

新規パイプラインを追加する方法

保存済みデータ外部連携を使用したデータのインポートについて

クラウドストレージサービスからデータをインポートする

パイプラインのスケジュール設定について

ローカルデータベースからデータをインポートする