Zoho DataPrepは、Amazon RDSというクラウドデータベースへのデータエクスポートに対応しています。Amazon RDSはAmazon Relational Database サービスとも呼ばれ、データベースの設定、運用、スケーリングを支援します。
Amazon RDS MS SQL Serverへのデータのエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。「ホーム」ページ、「Pipelines」タブ、または「Workspaces」タブから操作できます。データは
50以上のソースから取り込むことが可能です。
2.
Pipeline Builderページで、データフローの作成と各ステージで必要な
変換の適用が完了したら、ステージを右クリックし、
Destinationを追加オプションを選択します。
3. Cloud databasesカテゴリからAmazon RDSを選択するか、検索ボックスで検索して選択できます。
メモ: すでにAmazon RDSの接続を追加済みの場合は、保存済み外部連携セクションの既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべての列を含めるか除外することが可能です。
個人情報列を保護するため、以下のセキュリティ方法を適用できます。
A. データマスキング
データマスキングは個人情報を保護するため、元の内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各異なる値をランダムな値に置き換え、出力が元の内容と統計的に同一となります。
C. なし
セキュリティ方法を使用しない場合は「なし」を選択できます。
5. 次をクリックし、Database サービス 名前のドロップダウンでAmazon RDSを選択し、Database 種類のドロップダウンでMS SQL Serverを選択します。
6. Database 名前、SQL Server Instance 名前、Endpointを入力し、データベース接続の認証用にユーザー名とパスワードを入力します。
7. データベースサーバーがSSLによる暗号化データの提供に設定されている場合は、SSLの使用チェックボックスを選択することもできます。
8. Connection 名前に接続用の一意の名前を入力し、接続をクリックします。
メモ: データベースへの接続に問題が発生した場合は、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることを確認してください。これによりデータをクラウドデータベースへエクスポートできます。
こちらをクリックしてZoho DataPrepのIPアドレスをご確認ください。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化・保存されます。
9. クラウドデータベースに正常に接続できたら、データのエクスポート方法およびエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートしたい場合は、既存 tableを選択し、データベース内で利用可能なテーブルのリストから1つ選びます。既存テーブルオプションを選んだ場合、新規行の追加方法を2つの方法から選択できます。
- 新規行をテーブルに追加する場合は、Appendを選択します。
- 新規追加した行で既存行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名、テーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加した行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
メモ:
スケジュール実行や
バックフィル実行の場合、最初のエクスポートは新規テーブルに行われ、以降のエクスポートは既存テーブルに行われます。このオプションは、新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認した後、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細は
こちらをご参照ください。
Info: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得済みのデータは各ステージで申請済みの変換処理を用いて整形され、その後、宛先にエクスポート済みとなります。この一連の処理は
ジョブページで確認できます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルにデータをエクスポートする際、下記のターゲット照合エラーで手動実行が失敗した場合は、ターゲットマッチング手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐための、DataPrepの便利な機能です。
メモ: ターゲットマッチングは、新規テーブルへのデータエクスポートや
スケジュール実行によるパイプライン自動化時にも申請済みとなります。最初のスケジュール実行のみ新規テーブルとして扱われ、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲットマッチングが申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先へエクスポートされる前に実行されます。DataPrep の便利な機能であり、データモデルの不一致によるエクスポート失敗を防止します。ターゲットマッチングを利用すると、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルに合わせて照合できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。
メモ: ターゲットマッチングの失敗はエクスポート失敗と同じではありません。ターゲットマッチングは、データが実際にエクスポートされる前に行われます。これにより、エクスポートを失敗させる原因となるスキーマやデータモデルのエラーを事前に検出でき、エクスポート失敗を防ぎます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合、
DataPrep Studioページへ移動し、右上のターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセットの列は、ターゲットデータセットの列が見つかった場合、自動的に照合されます。
ターゲットマッチングでは、照合済み列および未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすると、既存の列をターゲット列に素早く照合するための変更を行うことができます。また、エラーの修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして関連付けられます。DataPrep Studioページで、テーブルとのマッピングや不一致がある箇所のエラーも併せて確認できます。エラーアイコンにカーソルを合わせることで内容を把握でき、クリックして個別にエラーを解決できます。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックすることで、必須オプションでフィルタリングできます。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられた列数が確認できます。必要なエラー列をクリックし、適用をクリックして特定のエラー列にフィルタリングできます。
ターゲット照合エラー概要
- ターゲット照合エラーセクションには、エラーおよびそれぞれのエラーに関連付けられた列数が表示されます。
- 上部のセクションには、エラーカテゴリーと各カテゴリー内のエラー数が一覧表示されます。
- それぞれをクリックすると、パネルで各カテゴリーに関連するエラーのみをフィルタリングして表示できます。
- 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックすることで該当列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示することも可能です。
- ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
ターゲットマッチングエラー
ターゲットマッチングのエラーについて、以下に説明します。
-
未照合列:このオプションでは、データ元とターゲットで一致していないすべての列が表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元の列は、照合するか削除してからエクスポートを続行してください。
未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうか確認し、含めてください。必須列のみ修正してエクスポートを続行することも可能です。
- データの種類不一致:このオプションでは、データ元にある列のうち、ターゲットの列とデータ型が一致しないものが表示されます。
- データ形式不一致:このオプションでは、データ元にある列のうち、ターゲットの列と日付・datetime・時間形式が異なるものが表示されます。
- 制約条件不一致:このオプションでは、ターゲットの列のデータの種類制約に一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列が表示されます。
メモ: 必須列は、照合され必須に設定されていない限り、宛先へエクスポートできません。列の上部にある

アイコンをクリックして、必須に設定できます。また、
データの種類変更変換の下にある
必須として設定(null不可) チェックボックスを利用して、列を必須に設定することも可能です。
- データサイズ超過警告:このオプションでは、ターゲットで許可されている最大サイズを超えたデータを持つ列をフィルタリングします。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。
手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについてはこちらをご参照ください。