Amazon RDS PostgreSQLへのデータエクスポート

Amazon RDS PostgreSQLへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。


Zoho DataPrepは、Amazon RDS(クラウドデータベース)へのデータエクスポートに対応しています。Amazon RDSはAmazon Relational Database サービスとも呼ばれ、データベースの設定、運用、スケールを支援します。

Amazon RDS PostgreSQLへのデータエクスポート方法

1. 既存のパイプラインを開くか、パイプラインを作成してくださいホームページ、 Pipelinesタブ、または Workspacesタブから操作できます。50以上のソースからデータを取り込むことが可能です。

2. Pipeline Builderページで、データフローの作成と必要な変換の適用が完了したら、ステージを右クリックし、宛先を追加オプションを選択します。



3. Cloud databasesカテゴリからAmazon RDSを選択するか、検索ボックスで検索してください。


メモ: Amazon RDSの接続を追加済みの場合は、保存済み外部連携セクションから既存の接続を選択し、そのままエクスポートを続行できます。

4. データに個人情報を含むカラムがある場合、個人情報カラムセクションで、一部またはすべてのカラムを含めるか除外するかを選択できます。

個人データ列を保護するため、以下のセキュリティ方法を適用することも可能です。

A. データマスキング  
データマスキングでは、個人情報を保護するため、元のデータ内容が「x」で隠されます。

B. データトークナイゼーション 
データトークナイゼーションは、データ内の各ユニークな値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一となります。

C. なし
セキュリティ方法を使用しない場合は、「なし」を選択できます。



5. をクリックし、Database サービス 名前のドロップダウンから Amazon RDS を、Database 種類のドロップダウンから PostgreSQL を選択します。

6. Database 名前Endpointを入力し、データベース接続認証のためにユーザー名パスワードを入力します。

7. データベースサーバーがSSLを使用して暗号化データを提供するよう設定されている場合は、SSLのチェックボックスも選択できます。

8. Connection 名前欄に接続の一意な名前を入力し、接続をクリックします。

メモ: データベースへの接続がうまくいかない場合は、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることを確認し、クラウドデータベースへのデータエクスポートができるようにしてください。こちらでZoho DataPrepのIPアドレスについてご確認いただけます。



メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。

9. クラウドデータベースへの接続が成功したら、データのエクスポート方法およびエクスポート先を選択できます。

10. 既存のテーブルにデータをエクスポートする場合は既存 tableを選択し、データベース内の利用可能なテーブル一覧から1つ選択します。既存テーブルオプションを選択した場合、新しい行をテーブルに追加する方法は2通りあります。
  1. 新しい行をテーブルに追加する場合は、Appendを選択します。
  2. 新しい行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。


11. 新規テーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、スキーマ名テーブル名を入力し、新しい行をテーブルにどのように追加するかを選択します。
  1. 新しい行をテーブルに追加する場合は、Appendを選択します。
  2. 追加した行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
メモ: スケジュール実行およびバックフィル実行の場合、最初のエクスポートは新規テーブルに行われ、以降のエクスポートは既存テーブルに対して行われます。この際、新しい行は既存テーブルに追加される設定が適用されます。
 


12. 保存をクリックします。宛先の追加が完了したら、まずは手動実行でパイプラインをテストしてみてください。手動実行が正常に動作することを確認した後、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細はこちらをご参照ください。

情報: 各実行はジョブとして保存されます。パイプライン実行時には、データソースから取得したデータが各ステージで適用した変換処理を経て、宛先にエクスポートされます。この一連の処理はジョブページに記録されます。

13. 手動実行でエラーが発生せず成功した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートする際、ターゲット照合エラーで手動実行が失敗した場合は、ターゲット照合手順を完了することで修正できます。

ターゲット照合は、データモデルの不一致によるエクスポート失敗を防止するDataPrepの便利な機能です。

メモ: 新規テーブルへのデータエクスポートやスケジュール実行によるパイプライン自動化でも、ターゲット照合は適用されます。最初のスケジュール実行では新規テーブルとして扱われますが、その後のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲット照合が適用されます。
 




クラウドデータベースへのエクスポート時のターゲット照合

ターゲット照合は、データが宛先にエクスポートされる前に行われます。ターゲット照合は、DataPrepで提供される便利な機能で、データモデルの不一致によるエクスポート失敗を未然に防ぎます。ターゲット照合を使用すると、必要なクラウドデータベーステーブルをターゲットとして設定し、元データセットの列をターゲットテーブルに合わせて整合させることができます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

メモ: ターゲット照合の失敗は、エクスポートの失敗とは異なります。ターゲット照合は、データが実際に宛先へエクスポートされる前に行われます。この仕組みにより、スキーマやデータモデルの不一致によるエクスポート失敗となりうるエラーを事前に検出し、エクスポートの失敗を防止できます。

ターゲット照合チェックが失敗した場合

1. エクスポート中にターゲット照合チェックが失敗した場合は、DataPrep Studio ページへ移動し、右上のターゲット照合アイコン をクリックし、ターゲット表示オプションを選択します。ターゲットのデータモデルが既存の元データセットの上に表示されます。元データセット内の列は、自動的にターゲットデータセット内の列に照合されます(対応する列が存在する場合)。




ターゲット照合では、照合済み列と未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列とターゲット列を素早く照合できます。エラーの修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐付けられます。DataPrep Studioページで、テーブルとのマッピングと、照合不一致箇所のエラーを確認できます。エラーアイコンにマウスオーバーして問題の内容を確認し、クリックして個別に解決できます。

メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして、必須項目のみをフィルター表示することも可能です。
2. 概要表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、各種モデル照合エラーや、それぞれのエラーに関連付けられた列数を確認できます。必要なエラー列をクリックし、適用をクリックして特定のエラー列のみをフィルター表示できます。



Target照合エラー概要

  1. Target照合エラーのセクションでは、エラー内容と各エラーに関連付けられている列番号が表示されます。
  2. 上部のセクションには、エラーカテゴリごとにエラー数とともに一覧表示されます。
  3. 各カテゴリをクリックすると、パネル内でそのカテゴリに関連するエラーだけを絞り込めます。
  4. 初期表示ではすべての列が表示されますが、任意のエラーカテゴリをクリックして、該当する列を詳しく確認したり、エラーのみ表示のチェックボックスを選択してエラーのある列だけを表示したりできます。
  5. フィルターの選択は、Target照合エラー概要だけでなく、DataPrep Studioページ上のグリッドにも適用されます。

Target照合エラー

ターゲットマッチングにおけるエラーについて、以下で説明します。
  1. 未照合の列:このオプションでは、データ元およびターゲットで一致していないすべての列が表示されます。

    メモ:
    1. ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合することも、無視することもできます。
    2. ターゲットに存在しないデータ元の列は、照合するか削除しないとエクスポートを続行できません。

    未照合の列オプションを使用する場合、「必須列のみ表示」オプションを切り替えることで、ターゲットで必須に設定されている列があるか確認し、含めることができます。また、必須列のみを修正してエクスポートを続行することも可能です。


  1. データの種類の不一致:このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものが表示されます。
  2. データ形式の不一致:このオプションでは、データ元の列のうち、日付・日時・時間のフォーマットがターゲットと異なるものが表示されます。
  3. 制約の不一致:このオプションでは、ターゲットの列のデータ型制約に一致しない列が表示されます。列に制約を追加する方法については、こちらをご覧ください。
  4. 必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列が表示されます。

    メモ: 必須列は、照合して必須に設定しない限り、宛先にエクスポートできません。列を必須に設定するには、上記のアイコンをクリックしてください。また、必須(null不可)として設定チェックボックスをデータ型を変更トランスフォーム内で使用して、列を必須にすることも可能です。
  5. データサイズ超過警告:このオプションでは、ターゲットで許可されている最大サイズを超えている列をフィルタリングします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行が正常に動作することを確認したら、パイプラインを自動化するスケジュールを設定できます。各種実行タイプの詳細はこちらをご参照ください。