Zoho DataPrepは、クラウドデータベースであるAmazon RDSへのデータエクスポートに対応しています。Amazon RDSはAmazon Relational Database サービスとも呼ばれ、データベースの設定、運用、スケールを支援します。
Amazon RDS MySQLへのデータエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。
ホームページ、
Pipelinesタブ、または
Workspacesタブから操作できます。
50以上のソースからデータを取り込むことが可能です。
2.
Pipeline Builderページで、データフローの作成と必要な
変換の適用が完了したら、ステージを右クリックし、
Destinationの追加オプションを選択します。
3. Cloud databasesカテゴリーからAmazon RDSを選択するか、検索ボックスで検索してください。
メモ: すでにAmazon RDSの接続を追加済みの場合は、保存済み外部連携セクションから既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで、必要に応じて一部またはすべての列を含めるか除外することができます。
必要に応じて、下記のセキュリティ手法を適用し、個人情報列を保護できます。
A. データマスキング
データマスキングは個人情報を保護するため、元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各ユニーク値をランダムな値に置き換え、出力が元のデータと統計的に同一となるようにします。
C. なし
セキュリティ手法を使用しない場合は「なし」を選択できます。
5. 次をクリックし、Database サービス 名前ドロップダウンからAmazon RDSを、Database 種類ドロップダウンからMySQLを選択します。
6. Database 名前、Endpointを入力し、認証のためにユーザー名とパスワードを入力します。
7. データベースサーバーがSSLによる暗号化通信に対応している場合は、SSLのチェックボックスを選択できます。
8. Connection 名前に接続用の一意の名前を入力し、接続をクリックします。
メモ: データベースへの接続で問題が発生した場合は、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されているかご確認ください。これにより、クラウドデータベースへのデータエクスポートが可能となります。
こちらをクリックして、Zoho DataPrep の IP アドレスについてご確認ください。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保管されます。
9. クラウドデータベースへの接続が完了したら、データのエクスポート方法やエクスポート先を選択できます。
10. データを既存テーブルにエクスポートしたい場合は、既存 tableを選択し、データベース内の利用可能なテーブル一覧からいずれかを選択します。既存テーブルを選択した場合、新しい行をテーブルに追加する方法は2通りあります。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加する行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規 tableオプションを選択し、Schema 名前とTable 名前を入力し、新しい行をテーブルに追加する方法を選択してください。
- 新しい行をテーブルに追加する場合は、Appendを選択してください。
- 新しく追加される行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択してください。
メモ:
スケジュールおよび
バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、その後のエクスポートは既存テーブルに完了します。このオプションは新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。送信先を追加したら、まず手動実行でパイプラインを実行してみましょう。手動実行が正常に動作することを確認した後、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプの詳細は
こちらをご覧ください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得したデータは、各ステージに申請済みの一連の変換によって処理され、その後データが宛先にエクスポートされます。この一連の処理は
ジョブページで確認できます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートしていて、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲットマッチングの手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。
メモ: ターゲットマッチングは、新規テーブルへのデータエクスポートや
スケジュール実行でパイプラインを自動化する場合にも申請されます。最初のスケジュール実行時のみ新規テーブルとして扱われ、その後のエクスポートでは新規テーブルは既存テーブルとして扱われ、ターゲットマッチングが申請されます。
クラウドデータベースへのエクスポート時のターゲット照合
ターゲット照合は、データが宛先にエクスポートされる前に実行されます。DataPrepのこの機能により、データモデルの不一致によるエクスポート失敗を防ぐことができます。ターゲット照合を利用すると、目的のクラウドデータベーステーブルをターゲットとして設定し、元データセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへスムーズにエクスポートできます。
メモ: ターゲット照合の失敗は、エクスポート失敗とは異なります。ターゲット照合は、データが実際に宛先へエクスポートされる前に実施されます。この仕組みにより、エクスポート失敗の原因となるスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぐことができます。
ターゲット照合チェックが失敗した場合
1. エクスポート時にターゲット照合チェックが失敗すると、
DataPrep Studioページに移動し、右上のターゲット照合アイコン

をクリックし、
ターゲットを表示オプションを選択してください。ターゲットのデータモデルが既存の元データセットの上部に表示されます。元データセット内の列は、自動的にターゲットデータセットの列と一致するように整列されます(一致する場合)。
ターゲット照合では、照合済みまたは未照合の列ごとに異なるアイコンや提案が表示されます。提案をクリックすることで、既存の列とターゲット列を迅速に照合できるよう修正できます。エラーの修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐付けられます。DataPrep Studioページ上で、データとテーブルのマッピングや不一致箇所のエラーを確認できます。エラーアイコンにマウスオーバーすると問題の詳細が表示され、アイコンをクリックするとエラーの解決が可能です。
メモ: すべての列が初期設定でグリッドに表示されますが、すべての列リンクをクリックすることで、必須オプションで絞り込みが可能です。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要を確認できます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連する列数が表示されます。必要なエラー列をクリックし、適用をクリックして特定のエラー列で絞り込みが可能です。
Target照合エラー概要
- Target照合エラーのセクションでは、エラー内容と各エラーに関連付けられた列の番号が表示されます。
- 上部のセクションにはエラーカテゴリと、各カテゴリ内のエラー数が一覧表示されます。
- 各カテゴリをクリックすることで、そのカテゴリに関連するエラーのみをパネルでフィルタリングできます。
- 初期表示ではすべての列が表示されますが、エラーカテゴリをクリックすると該当する列の詳細を確認できます。また、エラーのみ表示のチェックボックスを選択することで、エラーのある列のみを表示できます。
- Target照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
Target照合エラー
ターゲットのマッチングエラーについて、以下に説明します。
-
未照合列:このオプションでは、データ元とターゲットで一致しないすべての列が表示されます。
メモ:
- ターゲットで必須ではない列は、利用可能であればデータ元の列と照合するか、無視することができます。
- ターゲットに存在しないデータ元の列は、照合するか削除してエクスポートを続行してください。
未照合列オプションを使用する際は、「必須列のみ表示」オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。また、必須列のみを修正してエクスポートを続行することも可能です。
- データの種類不一致:このオプションでは、データ元の列でターゲットの列のデータ型と一致しないものが表示されます。
- データ形式不一致:このオプションでは、データ元の列で日付、datetime、時間のフォーマットがターゲットと異なるものが表示されます。
- 制約条件不一致:このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをご参照ください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列が表示されます。
メモ: 必須列は、照合されて必須に設定されていない限り、宛先にエクスポートできません。上記の

アイコンをクリックして列を必須に設定できます。また、
必須に設定(not null)チェックボックスを
データ型変更トランスフォーム内で使用して、列を必須に設定することも可能です。
- データサイズ超過警告:このオプションでは、ターゲットで許可されている最大サイズを超えるデータが含まれる列をフィルタリングします。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。
手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインの自動化が可能です。さまざまな実行タイプについてはこちらをご参照ください。