Zoho DataPrepは、クラウドデータベースであるAmazon RDSへのデータエクスポートに対応しています。Amazon RDS(Amazon Relational Database サービス)は、データベースの設定、運用、スケーリングを支援します。
Amazon RDS Amazon Aurora PostgreSQLへのデータエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。
ホームページ、
Pipelinesタブ、または
Workspacesタブから操作できます。
50以上のソースからデータを取り込むことが可能です。
2.
Pipeline Builderページで、データフローの作成と必要な
変換の適用が完了したら、ステージを右クリックし、
Destinationを追加を選択します。
3. Cloud databasesカテゴリーからAmazon RDSを選択するか、検索ボックスで検索できます。
メモ: 以前にAmazon RDS接続を追加している場合は、保存済み外部連携セクションから既存の接続を選択し、エクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべての列を含めるか除外することができます。
必要に応じて、以下のセキュリティ対策をデータ列に適用することも可能です。
A. データマスキング
データマスキングは、元のデータ内容を「x」で隠し、個人情報を保護します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各固有の値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一です。
C. なし
セキュリティ対策を使用しない場合は「なし」を選択できます。
5. 次をクリックし、Database サービス 名前ドロップダウンからAmazon Aurora PostgreSQLを選択します。
6. データベース接続を認証するために、Endpoint、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLを利用して暗号化データを提供するよう設定されている場合は、使用する SSLのチェックボックスを選択することもできます。
8. Connection 名前欄に接続の一意な名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続に問題が発生した場合は、クラウドデータベースへのデータエクスポートを行うため、お使いのアプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることをご確認ください。Zoho DataPrepのIPアドレスについては
こちらをクリックしてください。
9. Amazon RDSアカウントへの接続が正常に完了したら、データのエクスポート方法とエクスポート先を選択できます。
10. データを既存のテーブルにエクスポートしたい場合は、既存 tableを選択し、データベース内の利用可能なテーブル一覧から1つを選択します。既存テーブルを選択した場合、新しい行の追加方法として2通りから選択できます。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 追加した新しい行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 追加した行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ:
スケジュールおよび
バックフィル実行の場合、最初のエクスポートは新規テーブルに実行され、その後のエクスポートは既存テーブルに実行されます。このオプションは、新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。宛先が追加されたので、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについては
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得されたデータは各ステージで適用した一連の変換処理を経て準備され、その後宛先にエクスポートされます。この一連のプロセスは
ジョブページで確認できます。
13. 手動実行がエラーなく成功すると、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートしている場合、手動実行でターゲットマッチングエラーが発生した際は、ターゲットマッチングの手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。
メモ: データを新規テーブルにエクスポートし、
スケジュール実行オプションでパイプラインを自動化した場合でも、ターゲットマッチングは申請済みとなります。最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルは既存テーブルとして扱われ、ターゲットマッチングは申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データがエクスポートされる前に行われます。DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲットマッチングを使用すると、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへスムーズにエクスポートすることが可能です。
メモ: ターゲットマッチングの失敗はエクスポート失敗と同じではありません。ターゲットマッチングは、データが実際にエクスポートされる前に実行されます。そのため、スキーマやデータモデルのエラーによるエクスポート失敗を事前に検出し、防止できます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合、
DataPrep Studioページに移動し、画面右上にあるターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセット内の列は、ターゲットデータセットの列に自動的に照合されます(一致する場合)。
ターゲットマッチングでは、照合済み列と未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存列とターゲット列を素早く照合できます。エラー修正を容易にするため、クラウドデータベース内のターゲットタブがあなたのデータにターゲットとして紐付けられます。DataPrep Studioページでデータとテーブルのマッピングや、不一致がある箇所でのエラーも確認可能です。エラーアイコンにカーソルを合わせると詳細を確認でき、クリックして個々のエラーを解決できます。
メモ: 初期設定ですべての列がグリッドに表示されますが、すべての列リンクをクリックすることで、必須オプションに絞り込むことも可能です。
2. 表示する 概要リンクをクリックすると、対象の照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられた列の数が示されます。必須エラー列をクリックし、適用するをクリックすることで、特定のエラー列を絞り込むことができます。
ターゲット照合エラー概要
- ターゲット照合エラーセクションには、エラーと各エラーに関連付けられている列の数が表示されます。
- 画面上部のセクションには、エラーカテゴリーごとのエラー数が一覧表示されます。
- 各カテゴリーをクリックすることで、そのカテゴリーに関連するエラーのみをパネルで絞り込むことができます。
- 初期表示では、すべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳細に確認したり、エラーのみ表示チェックボックスを選択してエラー列のみを表示したりできます。
- ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページ内のグリッドにも適用されます。
ターゲット照合エラー
ターゲットの照合エラーについて、以下に説明します。
-
未照合の列:このオプションでは、データ元とターゲットで未照合のすべての列が表示されます。
メモ:
- ターゲットの必須ではない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
- ターゲットに存在しないデータ元の列は、照合するか削除してエクスポートを続行してください。
未照合の列オプションを利用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列のみを修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列でターゲットの列とデータの種類が一致しないものが表示されます。
- データ形式の不一致:このオプションでは、データ元の列で日付・日時・時間の形式がターゲットと異なる列が表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータの種類の制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列が表示されます。
メモ: 必須列は、照合され必須設定されていない限り、宛先へのエクスポートができません。列を必須に設定するには、上記の

アイコンをクリックしてください。また、
必須に設定(Not null)チェックボックスを
データの種類の変更トランスフォームで使用し、列を必須として設定できます。
- データサイズ超過の警告:このオプションでは、ターゲットで許可されている最大サイズを超えるデータを持つ列がフィルタリングされます。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。
手動実行が正常に動作することを確認したら、パイプラインの自動化スケジュールを設定できます。さまざまな実行タイプの詳細はこちらをご参照ください。