Microsoft Azure PostgreSQLへのデータエクスポート
お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Zoho DataPrepは、クラウドデータベースカテゴリーにおいてMicrosoft Azureへのデータエクスポートをサポートしています。AzureはMicrosoftが運営するクラウドコンピューティングプラットフォームであり、アプリケーションやサービスのアクセス、管理、開発を提供します。
Microsoft Azure PostgreSQLへのデータエクスポート方法
1.
既存のパイプラインを開くか、パイプラインを作成します。ホームページ、パイプラインタブ、またはワークスペースタブから操作できます。データは50以上のソースから取り込むことが可能です。
2.
パイプラインビルダーページで、データフローの作成と必要な
変換の適用が完了したら、ステージを右クリックし、
宛先を追加オプションを選択します。
3. Cloud databasesカテゴリーからMicrosoft Azureを選択するか、検索ボックスで検索できます。
メモ: 以前にMicrosoft Azure連携を追加している場合は、保存済み外部連携セクションで既存の連携を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。
個人情報列の保護のため、以下のセキュリティ方法も適用できます。
A. データマスキング
データマスキングは、個人情報保護のために元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一となります。
C. なし
セキュリティ手法を使用しない場合は「なし」を選択できます。
5. 次へをクリックし、Database サービス 名前ドロップダウンでMicrosoft Azureを選択し、Database 種類ドロップダウンでPostgreSQLを選択します。
6. データベース接続を認証するため、Server 名前、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLで暗号化されたデータを提供するように設定されている場合は、使用する SSLのチェックボックスも選択できます。
8. Connection 名前に接続の一意な名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保存されます。
メモ: データベースへの接続で問題が発生した場合は、Zoho DataPrepのIPアドレスがアプリケーションで許可リストに登録されていることを確認してください。これにより、クラウドデータベースへのデータエクスポートが可能になります。
9. クラウドデータベースへの接続が正常に完了すると、エクスポート方法やエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートしたい場合は、既存 tableを選択し、データベース内の利用可能なテーブル一覧から1つを選択します。既存テーブルオプションを選択した場合、新しい行をテーブルに追加する方法は2通りあります。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加した行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新しいテーブルを作成しデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルに追加する方法を選択してください。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、追加(Append)を選択してください。
- 新しく追加した行で既存の行を置き換える場合は、ドロップダウンから上書き(Overwrite)を選択してください。
メモ:
スケジュールおよび
バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、以降のエクスポートは既存テーブルに完了します。このオプションは新しい行を既存テーブルに追加するために使用されます。
12.
保存をクリックします。宛先の追加が完了したら、まず手動実行でパイプラインを試すことをおすすめします。手動実行が正常に動作することを確認した後、スケジュールを設定してパイプラインの自動化が可能です。さまざまな実行タイプについては
こちらを参照してください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得されたデータは各ステージで適用した一連の変換処理を経て、宛先にエクスポートされます。この一連のプロセスは
ジョブページに記録されます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベース内の既存テーブルにデータをエクスポートしている場合、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲット照合ステップを完了させることで修正できます。
ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐ便利な機能です。
メモ: Target matchingは、たとえデータを新規テーブルへエクスポートし、
Schedule runオプションを使ってパイプラインを自動化した場合でも申請済みとなります。初回のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、target matchingは申請済みとなります。
クラウドデータベースへのエクスポート時のTarget matching
Target matchingは、データがエクスポートされる前に行われます。Target matchingは、DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。Target matchingを利用することで、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルと照合して整列できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。
メモ: Target matchingの失敗は、エクスポート失敗とは異なります。Target matchingは、データが実際にエクスポートされる前に実行されます。この仕組みにより、スキーマやデータモデルのエラーによるエクスポート失敗を事前に検知し、防止できます。
Target照合チェックが失敗した場合
1. エクスポート中にtarget照合チェックが失敗した場合、
DataPrep Studioページに移動し、右上のtarget matchingアイコン

をクリックし、
表示targetオプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセット内の列は、該当する場合、自動的にターゲットデータセットの列と照合され整列します。
Target matchingでは、照合済み列および未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列とターゲット列を素早く照合するための変更を簡単に行えます。エラー修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐付けられています。DataPrep Studioページで、データとテーブルのマッピングや、不一致がある箇所にはエラーもあわせて確認できます。エラーアイコンにカーソルを合わせると内容を確認でき、クリックして各エラーを解決できます。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックすることで、必須オプションのみをフィルター表示できます。
2. 表示する 概要リンクをクリックすると、対象の照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられた列数が確認できます。必要なエラー列をクリックし、適用するをクリックして、特定のエラー列のみを出力にフィルターできます。
Target照合エラー概要
- Target照合エラーセクションでは、エラー内容およびそれぞれのエラーに関連付けられた列数が表示されます。
- 上部のセクションには、各エラーカテゴリーと、そのカテゴリー内のエラー数が一覧表示されます。
- 各カテゴリーをクリックすると、パネル内で該当カテゴリーに関連するエラーだけをフィルターできます。
- 初期設定の表示では、すべての列が表示されますが、任意のエラーカテゴリーをクリックすることで、該当する列の詳細を確認したり、エラーのみ表示のチェックボックスを選択してエラー列だけを表示したりできます。
- Target照合エラー概要で選択したフィルターは、DataPrep Studioページ内のグリッドにも反映されます。
Target照合エラー
Target照合におけるエラーの詳細は以下の通りです。
-
未照合の列:このオプションでは、データ元とターゲットで未照合のすべての列が表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元の列は、照合するか、エクスポートを続行するために削除する必要があります。
未照合の列オプションを使用する際、必須列のみ表示オプションを切り替えることで、ターゲットで必須に設定されている列があるかを確認し、それらを含めることができます。必須列のみ修正し、エクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元にあるデータの種類がターゲットの列と一致しない列が表示されます。
- データ形式の不一致:このオプションでは、データ元にある日付、datetime、時間の形式がターゲットと異なる列が表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータの種類制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列が表示されます。
メモ: 必須列は、照合されてかつ必須として設定されていない限り、宛先にエクスポートできません。アイコン

をクリックして、列を必須に設定できます。また、
必須として設定(null不可)チェックボックスを
データの種類の変更トランスフォームで使用し、列を必須に設定できます。
- データサイズ超過の警告:このオプションでは、ターゲットで許可されている最大サイズを超えるデータを持つ列をフィルタリングします。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。
手動実行が正常に動作することを確認したら、パイプラインの自動化スケジュールを設定できます。さまざまな実行タイプについてはこちらをご参照ください。