Zoho DataPrepを使用すると、Google Cloud SQLというクラウドデータベースへデータのエクスポートが可能です。Google Cloud Platform上でリレーショナルデータベースの設定、保守、管理、運用を支援するフルマネージド型のデータベースサービスです。
Google Cloud SQL - PostgreSQL へのデータエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。「ホーム」ページ、「Pipelines」タブ、または「Workspaces」タブから操作できます。
50以上のソースからデータを取り込むことができます。
2.
Pipeline Builderページで、データフローの作成と必要な
変換処理の適用が完了したら、ステージを右クリックして
Destinationを追加オプションを選択します。
3. Cloud databasesカテゴリからGoogle Cloud SQLを選択するか、検索ボックスで検索して選択します。
メモ: すでにGoogle Cloud SQLの接続を追加済みの場合は、保存済み外部連携セクションの既存接続を選択するだけで、エクスポート作業を継続できます。
4. データに個人情報を含む列がある場合は、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。
必要に応じて、下記のセキュリティ手法を列に適用し、データを保護できます。
A. データマスキング
データマスキングは、個人情報を保護するために元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各固有値をランダムな値に置き換え、出力が元のデータと統計的に同一となるようにします。
C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。
5. 次をクリックし、Database サービス 名前のドロップダウンからGoogle Cloud SQLを選択し、Database 種類のドロップダウンからPostgreSQLを選択します。
6. データベース接続を認証するために、Endpoint、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSL経由で暗号化データの提供に設定されている場合は、使用する SSLチェックボックスも選択できます。
8. Connection 名前 欄に接続用の一意の名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続に問題が発生した場合は、アプリケーションでZoho DataPrepのIPアドレスが許可リストに登録されていることを確認してください。クラウドデータベースへのデータエクスポートには必要です。Zoho DataPrepのIPアドレスについては
こちらをクリックしてご確認ください。
9. Google Cloud SQLアカウントへの接続が正常に完了したら、データのエクスポート方法やエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートしたい場合は、既存 table を選択し、データベース内の利用可能なテーブル一覧から1つ選択します。既存 table オプションを選ぶと、新規行をテーブルに追加する方法を2つから選べます。
- 新規行をテーブルに追加する場合はAppendを選択します。
- 新規追加した行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加された行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
メモ:
スケジュール実行や
バックフィル実行の場合、最初のエクスポートは新規テーブルに対して行われ、以降のエクスポートは既存のテーブルに対して行われます。このオプションは新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定して自動化できます。各種実行タイプの詳細は
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得されたデータは、各ステージで適用した一連の変換処理を通じて準備され、その後宛先にエクスポートされます。この一連の処理は
ジョブページで確認できます。
13. 手動実行がエラーなく成功すると、データは正常にエクスポートされます。クラウドデータベースの既存テーブルへデータをエクスポートしていて、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲットマッチング手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐDataPrepの便利な機能です。
メモ:
Target matchingは、データを新規テーブルにエクスポートし、
スケジュール実行オプションでパイプラインを自動化した場合でも「申請済み」となります。最初のスケジュール時のみ新規テーブルとして扱われ、その後のエクスポートでは新規テーブルが既存テーブルとして扱われ、「申請済み」となります。
クラウドデータベースへのエクスポート時のTarget matching
Target matchingは、データが宛先へエクスポートされる前に実行されます。Target matchingは、DataPrepにおいてデータモデルの不一致によるエクスポート失敗を防ぐ便利な機能です。Target matchingを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをシームレスにクラウドデータベースへエクスポートできます。
メモ: Target matchingの失敗はエクスポート失敗と同じではありません。Target matchingは、データが実際に宛先へエクスポートされる前に実行されます。このしくみにより、スキーマやデータモデルのエラーが事前に検出され、エクスポート失敗を防止できます。
Target照合チェックが失敗した場合
1. エクスポート中にTarget照合チェックが失敗した場合は、
DataPrep Studioページに移動し、右上のtarget matchingアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存データ元データセットの上部に表示されます。データ元データセット内の列は自動的にターゲットデータセットの列に照合されます(一致するものがある場合)。
Target matchingでは、照合済みおよび未照合の列に対して異なるアイコンや提案が表示されます。提案部分をクリックすると、既存の列をターゲット列に素早く照合できます。エラー修正を簡単に行えるよう、クラウドデータベースのターゲットタブがデータのターゲットとして紐付けられています。DataPrep Studioページで、データとテーブルのマッピングをエラー箇所とともに確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして個別にエラーを解決してください。
メモ: すべての列は初期設定でグリッドに表示されますが、すべての列リンクをクリックして必須オプションのみをフィルタリングすることもできます。
2. 表示する 概要リンクをクリックして、対象の照合エラーの概要を表示します。概要には、さまざまなモデルの照合エラーと、それぞれのエラーに関連付けられた列数が表示されます。必須エラー列をクリックし、適用するをクリックすると、特定のエラー列だけを出力としてフィルターできます。
Target 照合する エラー 概要
- Target照合エラーセクションでは、エラーとそれぞれのエラーに関連付けられている列数が表示されます。
- 画面上部のセクションには、エラーカテゴリーごとのエラー数がカテゴリ別に一覧表示されます。
- 各カテゴリーをクリックすることで、パネル内でそのカテゴリーに関連するエラーのみをフィルターできます。
- 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックすると、該当する列の詳細を確認したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示することも可能です。
- Target照合エラー概要で指定したフィルターは、DataPrep Studioページのグリッドにも反映されます。
Target matching errors
ターゲットのマッチングエラーについて、以下の通り説明します。
-
未照合の列:このオプションでは、データ元およびターゲットで未照合のすべての列が表示されます。
メモ:
- ターゲットの非必須列は、利用可能な場合はデータ元列と照合、または無視することができます。
- ターゲットに存在しないデータ元の列は、照合するか削除しないとエクスポートを続行できません。
未照合の列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列のみを修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列でターゲットの列とデータ型が一致しないものが表示されます。
- データ形式の不一致:このオプションでは、データ元の列で日付、datetime、時間の形式がターゲットと異なるものが表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法は、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須になっていない列が表示されます。
メモ: 必須列は、照合され必須に設定されていない限り、宛先へエクスポートできません。列の上にある

アイコンをクリックし、必須に設定できます。
必須として設定(null不可)チェックボックスを、
データ型変更変換の下で使用して、列を必須に設定することも可能です。
- データサイズオーバーフロー警告:このオプションは、ターゲットで許可されている最大サイズを超えたデータが含まれる列をフィルタリングします。
3. エラー修正後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。手動実行が正常に動作することを確認したら、パイプラインの自動化スケジュールを設定できます。さまざまな実行タイプについては
こちらをご参照ください