2. 検索ボックスに送信先名を入力するか、クラウドデータベースカテゴリを選択し、必要なエクスポートオプションを選択します。
メモ: すでにクラウドデータベース接続を追加している場合は、保存済み接続セクションから既存の接続を選択し、そのままエクスポートを続行できます。
3. データに個人データや電子的保護対象医療情報(ePHI)を含む列がある場合は、列セクションでエクスポートする列を選択できます。
また、個人データの列を保護するために必要なセキュリティ方式を適用できます。
A. データマスキング
B. データトークナイゼーション
4. [次へ]をクリックし、データベースサービス名とデータベースタイプを選択し、エンドポイントやデータベース名など必須フィールドに値を入力して、クラウドデータベース接続を設定します。
5. データベース接続で認証が必要な場合は、ユーザー名とパスワードも入力できます。
6. 一意の接続名を入力します。
7. データベースサーバーが SSL による暗号化通信に対応している場合は、SSL を使用チェックボックスを選択できます。
8. [接続]ボタンをクリックします。
9. クラウドデータベースへの接続が正常に完了したら、データのエクスポート方法とエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートする場合は、既存のテーブルを選択し、データベース内のテーブル一覧からテーブルを選択します。既存のテーブルオプションを選択した場合、新しい行をテーブルに追加する方法は 2 通りあります。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 新しい行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
11. 新しいテーブルを作成してデータをエクスポートする場合は、新しいテーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 新しい行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ: スケジュール実行やバックフィル実行の場合、最初のエクスポートは新しいテーブルに対して行われ、その後のエクスポートでは同じテーブルが既存のテーブルとして扱われます。ターゲットマッチが成功したタイミングでデータがエクスポートされます。パイプラインを実行した後にターゲットマッチエラーを確認することも、パイプラインビルダーページから直接ステージを開いて確認することもできます。
12.
[保存]をクリックします。送信先を追加したら、まずは手動実行でパイプラインを実行してみてください。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプの詳細は
こちらをご覧ください。
Info: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得したデータに対して、各ステージで設定した一連の変換が適用され、その後データが送信先にエクスポートされます。この一連の処理はすべて
ジョブページに記録されます。
13. 手動実行がエラーなく成功すると、データは正常にエクスポートされます。クラウドデータベース内の既存テーブルにデータをエクスポートしていて、手動実行時に次のようなターゲットマッチエラーが発生した場合は、ターゲットマッチングの手順を完了して修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐための、DataPrep の便利な機能です。
メモ:
スケジュール実行 オプションを使用して新しいテーブルにデータをエクスポートし、パイプラインを自動化する場合でも、ターゲットマッチングは適用されます。最初のスケジュール実行時のみ新しいテーブルとして扱われますが、その後のエクスポートでは新しいテーブルは既存テーブルとして扱われ、ターゲットマッチングが適用されます。
ターゲットマッチングは、データが宛先にエクスポートされる前に実行されます。ターゲットマッチングは、データモデルの不一致によるエラーが原因で発生するエクスポート失敗を防ぐ、DataPrep の便利な機能です。ターゲットマッチングを使用すると、必要なクラウドデータベースのテーブルをターゲットとして設定し、ソースデータセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。
メモ: ターゲットマッチングの失敗は、エクスポートの失敗ではありません。ターゲットマッチングは、データが実際に宛先へエクスポートされる前に実行されます。この段階で、エクスポート失敗の原因となり得るスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぎます。
ターゲットマッチチェックが失敗した場合
1. エクスポート中にターゲットマッチチェックが失敗した場合は、
DataPrep Studioページに移動し、右上隅のターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。
ターゲットのデータモデルが、既存のソースデータセットの上部に表示されます。ソースデータセット内の列は、該当する場合、自動的にターゲットデータセットの列に合わせて整列されます。
ターゲットマッチングでは、一致している列と一致していない列に対して、さまざまなアイコンや提案が表示されます。これらの提案をクリックして、既存の列をターゲット列に合わせるための変更をすばやく行うことができます。エラーを簡単に修正できるように、クラウドデータベース内のターゲットタブが、データのターゲットとして関連付けられます。DataPrep Studioページでは、テーブルとのマッピングと、不一致がある箇所のエラーをあわせて確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして各エラーを解消できます。
メモ: すべての列は、デフォルトでグリッドに表示されます。ただし、すべての列リンクをクリックして、必要なオプションに絞り込むことができます。
2. サマリーを表示リンクをクリックすると、ターゲットマッチエラーのサマリーを確認できます。サマリーには、さまざまなモデルマッチエラーと、それぞれのエラーに関連付けられている列数が表示されます。必要なエラー列をクリックし、適用をクリックして、特定のエラー列だけに絞り込むことができます。
ターゲットマッチエラーのサマリー
- [ターゲットマッチエラー]セクションには、エラーの種類と、それぞれのエラーに関連付けられている列数が表示されます。
- 上部のセクションには、エラーカテゴリーと、それぞれのカテゴリーに含まれるエラー数が一覧表示されます。
- 各カテゴリーをクリックすると、そのカテゴリーに関連するエラーだけをパネル内に絞り込んで表示できます。
- デフォルトビューでは、すべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳しく確認したり、エラーのみを表示チェックボックスを選択してエラー列のみを表示したりできます。
- ターゲットマッチエラーのサマリーで行ったフィルターの選択内容は、DataPrep Studioページのグリッドにも適用されます。