Zoho DataPrepは、Amazon RDS(クラウドデータベース)へのデータエクスポートに対応しています。Amazon RDSはAmazon Relational Database サービスとも呼ばれ、データベースの設定、運用、スケーリングを支援します。
Amazon RDS Amazon Aurora MySQLへのデータエクスポート方法
2.
パイプラインビルダーページで、データフローの作成と必要な
変換を各ステージに適用した後、ステージを右クリックして
宛先を追加オプションを選択します。
3. クラウドデータベースカテゴリーからAmazon RDSを選択するか、検索ボックスで検索してください。
メモ: 既にAmazon RDS連携を追加済みの場合は、保存済み外部連携セクションから既存の連携を選択し、そのままエクスポートを進めることができます。
4. データ内に個人情報を含む列がある場合は、個人情報列セクションで、含めるまたは除外する列を選択できます。
必要に応じて、下記のセキュリティ手法を適用してデータ列を保護できます:
A. データマスキング
データマスキングは、個人情報を保護するために元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各固有値をランダムな値に置き換えます。これにより、出力は元のデータと統計的に同一となります。
C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。
5. 次をクリックし、Database サービス 名前のドロップダウンからAmazon Aurora MySQLを選択します。
6. データベース接続を認証するために、Endpoint、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLを使用して暗号化データを提供するよう設定されている場合は、使用する SSLのチェックボックスも選択できます。
8. Connection 名前に接続の一意の名前を入力し、接続をクリックします。
メモ: 接続構成は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保存されます。
メモ: データベースへの接続に問題がある場合は、クラウドデータベースへのデータエクスポートのために、Zoho DataPrepのIPアドレスがご利用アプリケーションでホワイトリストに登録されていることをご確認ください。Zoho DataPrepのIPアドレスについては
こちらをクリックしてください。
9. Amazon RDSアカウントへの接続が完了すると、データのエクスポート方法およびエクスポート先を選択できます。
10. データを既存のテーブルにエクスポートする場合は既存 tableを選択し、データベース内の利用可能なテーブル一覧から1つを選択します。既存テーブルオプションを選択した場合、新しい行の追加方法を2通りから選べます。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加された行で既存の行を置き換えたい場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、追加を選択してください。
- 新しく追加された行で既存の行を置き換える場合は、ドロップダウンから上書きを選択してください。
メモ:
スケジュール実行や
バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、それ以降のエクスポートは既存テーブルに完了します。このオプションは、新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインの実行をお試しください。手動実行が正常に動作することを確認できたら、スケジュールを設定してパイプラインの自動化が可能です。さまざまな実行タイプについては
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行が実行されると、データソースから取得済みのデータが各ステージで申請済みの一連の変換処理を使用して整備され、その後、宛先にエクスポート済みとなります。この完了プロセスは
ジョブページで確認できます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルにデータをエクスポートする際、手動実行で下記のターゲット照合エラーが発生した場合は、ターゲット照合ステップを完了することで修正できます。
ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐための、DataPrepの便利な機能です。
メモ: データを新規テーブルにエクスポートし、
スケジュール実行オプションでパイプラインを自動化した場合でも、ターゲットマッチングは申請済みとなります。初回のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルは既存テーブルとして扱われ、ターゲットマッチングは申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先にエクスポートされる前に行われます。DataPrepのターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐ便利な機能です。ターゲットマッチングを利用することで、目的のクラウドデータベーステーブルをターゲットに設定し、データ元データセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。
メモ: ターゲットマッチングの失敗はエクスポートの失敗と同じではありません。ターゲットマッチングは、データが実際にエクスポートされる前に行われます。この仕組みにより、スキーマやデータモデルのエラーを事前に検出し、エクスポート失敗を未然に防げます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合は、
DataPrep Studio ページに移動し、右上隅のターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択してください。ターゲットのデータモデルが既存のデータ元データセットの上に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列に照合されます(一致が見つかった場合)。
ターゲットマッチングでは、照合済みおよび未照合の列に対してさまざまなアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列とターゲット列を迅速に照合できます。エラー修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして関連付けられています。DataPrep Studioページで、データとテーブルのマッピングおよび不一致が発生している箇所のエラーも確認できます。エラーアイコンにカーソルを合わせて問題内容を確認し、クリックして個別のエラーを解決できます。
メモ: 初期設定ではすべての列がグリッドに表示されますが、すべての列リンクをクリックして必須オプションのみをフィルター表示することも可能です。
2. 表示する 概要リンクをクリックして、対象となる照合エラーの概要を表示します。概要には、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられている列の数が表示されます。必須エラーの列をクリックし、適用するをクリックして、特定のエラー列だけをフィルター表示できます。
Target 照合エラー概要
- Target照合エラーのセクションでは、エラーと各エラーに関連付けられている列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとにエラー数とともに一覧表示されます。
- 各カテゴリーをクリックすると、該当するカテゴリーのエラーのみをパネルでフィルターできます。
- 初期設定の表示では、すべての列が表示されますが、任意のエラーカテゴリーをクリックして、該当する列を詳細に確認したり、エラーのみ表示のチェックボックスを選択してエラー列だけを表示したりできます。
- Target照合エラー概要で設定したフィルターは、DataPrep Studioページのグリッドにも適用されます。
Target照合エラー
ターゲットマッチング時のエラーについて説明します。
-
未照合列:このオプションでは、データ元とターゲット間で未照合のすべての列が表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元の列は、照合するか削除してエクスポートを続行してください。
未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えることで、ターゲットで必須と設定されている列があるか確認し、それらを含めることができます。必須列のみを修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものが表示されます。
- データ形式の不一致:このオプションでは、データ元の列のうち、日付、datetime、時間のフォーマットがターゲットと異なるものが表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列が表示されます。
メモ: 必須列は、照合し必須に設定しない限り、エクスポート先にエクスポートできません。列を必須に設定するには、上記の

アイコンをクリックしてください。また、
必須(null不可)として設定チェックボックスを
データの種類を変更トランスフォームで使用し、列を必須として設定できます。
- データサイズ超過の警告:このオプションでは、ターゲットで許可されている最大サイズを超えるデータを持つ列をフィルタリングします。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。
手動実行が正常に動作することを確認したら、パイプラインの自動化のためにスケジュールを設定できます。各実行タイプの詳細についてはこちらをご参照ください。