Zoho DataPrepは、クラウドデータベースであるAmazon RDSへのデータエクスポートに対応しています。Amazon RDS(Amazon Relational Database サービスとしても知られています)は、データベースの設定、運用、スケーリングを支援します。
Amazon RDS Oracleへのデータエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。
ホームページ、
パイプラインタブ、または
ワークスペースタブから操作できます。
50以上のソースからデータを取り込むことも可能です。
2.
パイプラインビルダーページで、データフローの作成と必要な
変換を各ステージに適用した後、ステージを右クリックし、
宛先を追加オプションを選択します。
3. Cloud databasesカテゴリーからAmazon RDSを選択するか、検索ボックスで検索します。
メモ: 以前にAmazon RDS接続を追加済みの場合は、保存済み外部連携セクション内の既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべてを含めるか除外するかを選択できます。
必要に応じて、下記のセキュリティ方法を適用し、データ列を保護できます。
A. データマスキング
データマスキングは、個人情報を保護するために元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションでは、各固有の値がランダムな値に置き換えられます。出力は統計的に元のデータと同一です。
C. なし
セキュリティ方法を使用しない場合は「なし」を選択できます。
5. 次へをクリックし、Database サービス 名前ドロップダウンでOracleを選択します。
6. データベース接続を認証するために、エンドポイント、ポート、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLを使用して暗号化データを提供するように設定されている場合は、使用する SSLチェックボックスも選択できます。
8. Connection 名前欄に接続用のユニークな名前を入力し、接続をクリックします。
メモ: 接続構成は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続で問題が発生した場合は、クラウドデータベースへのデータエクスポートのために、Zoho DataPrep のIPアドレスがアプリケーションでホワイトリスト登録されていることを確認してください。Zoho DataPrepのIPアドレスについては
こちらをクリックしてください。
9. Amazon RDS アカウントへの接続が正常に完了すると、データをエクスポートする方法と場所を選択できます。
10. 既存のテーブルにデータをエクスポートしたい場合は、既存 tableを選択し、データベース内で利用可能なテーブルのリストから1つ選択します。既存 table オプションを選択すると、新しい行をテーブルに追加する方法を2つから選べます。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加された行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、スキーマ名およびテーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 新しく追加された行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ:
スケジュールおよび
バックフィル実行の場合、最初のエクスポートは新規テーブルに行われ、以降のエクスポートは既存テーブルに行われます。このオプションを使用して、新規行を既存テーブルに追加します。
12.
保存をクリックします。宛先が追加されたので、最初に手動実行でパイプラインを実行してみてください。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについては
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得済みのデータが各ステージで申請済みの一連の変換処理を通じて準備され、その後、宛先にエクスポート済みとなります。この完了した処理は
ジョブページで確認できます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポート済みとなります。クラウドデータベース内の既存テーブルにデータをエクスポートする際、もし手動実行で以下のターゲット照合エラーが発生した場合は、ターゲット照合手順を完了することで修正できます。
ターゲット照合は、データモデルの不一致によるエクスポート失敗を防止するためのDataPrepの便利な機能です。
メモ: Target matchingは、
Schedule runオプションを使用して新規テーブルへデータのエクスポートおよびパイプラインの自動化を行った場合でも申請済みとなります。初回のスケジュール時のみ新規テーブルとして扱われますが、2回目以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、target matchingは申請済みとなります。
クラウドデータベースへのエクスポート時のTarget matching
Target matchingは、データが送信先にエクスポートされる前に実行されます。Target matchingは、DataPrepにおいてデータモデルの不一致によるエクスポート失敗を防ぐための便利な機能です。target matchingを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセットのカラムをターゲットテーブルに合わせて調整できます。これにより、クラウドデータベースへ高品質なデータをスムーズにエクスポートできます。
メモ: Target matchingの失敗はエクスポート失敗とは異なります。Target matchingは、データが実際に送信先へエクスポートされる前に実行されます。これにより、スキーマやデータモデルのエラーが事前に検出され、エクスポート失敗を未然に防ぐことができます。
Target照合チェックが失敗した場合
1. エクスポート中にTarget照合チェックが失敗した場合、
DataPrep Studioページへ移動し、右上のtarget matchingアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセットのカラムは、ターゲットデータセットのカラムに自動的に照合されます(一致する場合)。
Target matchingでは、照合済みカラムおよび未照合カラムに対して異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存列とターゲット列を素早く照合できます。エラー修正をしやすくするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐づけられています。DataPrep Studioページで、テーブルとのマッピングや不一致がある箇所のエラーもあわせて確認できます。エラーアイコンにマウスを重ねることで問題の内容を確認でき、クリックして各エラーを解決できます。
メモ: 初期設定ではすべてのカラムがグリッドに表示されますが、すべてのカラムリンクをクリックすることで必須オプションのみをフィルター出力できます。
2. 表示する 概要リンクをクリックすると、対象となる照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられている列の数が示されます。必須エラー列をクリックし、適用するをクリックすることで、特定のエラー列のみを絞り込んで出力できます。
Target照合エラー概要
- Target照合エラーセクションでは、エラーとそれぞれのエラーに関連付けられている列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとのエラー数とともにカテゴリ一覧が表示されます。
- パネル内で各カテゴリーに関連するエラーを絞り込むには、該当するカテゴリーをクリックします。
- 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックすることで、該当する列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラー列のみを表示することも可能です。
- Target照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
Target照合エラー
ターゲットマッチングにおけるエラーについて以下に説明します。
-
未照合列:このオプションでは、データ元とターゲットのすべての未照合列が表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元列と照合するか、無視することができます。
- ターゲットに存在しないデータ元の列は、照合または削除してエクスポートを続行してください。
未照合列オプションを使用する際、必須列のみ表示オプションを切り替えることで、ターゲットで必須設定されている列が存在するか確認し、含めることができます。また、必須列のみ修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列でターゲットの列とデータ型が一致しないものが表示されます。
- データ形式の不一致:このオプションでは、データ元の列で日付、datetime、時間の形式がターゲットのものと異なる列が表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列が表示されます。
メモ:必須列は照合され、必須として設定されていない限り、宛先にエクスポートできません。列を必須に設定するには、上記の

アイコンをクリックしてください。
必須(null不可)として設定チェックボックスを、
データ型の変更トランスフォームで使用して列を必須に設定することもできます。
- データサイズオーバーフロー警告:このオプションは、ターゲットで許可されている最大サイズを超えている列をフィルタリングします。
3. エラー修正後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。
手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。実行タイプの詳細についてはこちらをご参照ください。