クラウドデータベースへのデータエクスポート

クラウドデータベースへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




次のクラウドデータベースにデータをエクスポートできます。
  1. Amazon RDS - MySQL
  2. Amazon RDS - MS SQL Server
  3. Amazon RDS - Oracle
  4. Amazon RDS - PostgreSQL
  5. Amazon RDS - Maria DB
  6. Amazon RDS - Amazon Aurora MySQL
  7. Amazon RDS - Amazon Aurora PostgreSQL
  8. Amazon Redshift
  9. Microsoft Azure-MySQL
  10. Microsoft Azure - PostgreSQL
  11. Microsoft Azure - Maria DB
  12. Microsoft Azure - SQL Database
  13. Microsoft Azure - SQL Data Warehouse
  14. Google Cloud SQL - MySQL
  15. Google Cloud SQL - PostgreSQL
  16. Snowflake
  17. Oracle Cloud
  18. IBM Cloud - DB2
  19. Heroku PostgreSQL
  20. Rackspace Cloud - MySQL
  21. Rackspace Cloud - Maria DB
  22. Panoply
  23. MySQL
  24. MS SQL Server
  25. Oracle
  26. PostgreSQL
  27. Maria DB
  28. MemSQL
  29. DB2

クラウドデータベースにデータをエクスポートする手順

1. 既存のパイプラインを開くか、パイプラインを作成し、ホームページ、パイプラインタブ、またはワークスペースタブから操作します。データは50 以上のソースから取り込むことができます。

2. パイプラインビルダーページで、データフローの作成と各ステージで必要な変換の適用が完了したら、ステージを右クリックし、送信先を追加オプションを選択します。




2. 検索ボックスに送信先名を入力するか、クラウドデータベースカテゴリを選択し、必要なエクスポートオプションを選択します。

 

Notesメモ: すでにクラウドデータベース接続を追加している場合は、保存済み接続セクションから既存の接続を選択し、そのままエクスポートを続行できます。

3. データに個人データや電子的保護対象医療情報(ePHI)を含む列がある場合は、セクションでエクスポートする列を選択できます。

また、個人データの列を保護するために必要なセキュリティ方式を適用できます。

A. データマスキング   
データマスキングでは、個人情報を保護するために元のデータを「x」でマスクします。

B. データトークナイゼーション
データトークナイゼーションでは、データ内のそれぞれの値をランダムな値に置き換えます。出力は統計的に元のデータと同一になります。

C. なし
セキュリティ方式を使用しない場合は「なし」を選択できます。各列のチェックボックスを使用して、これらの列をエクスポートするかどうかを選択できます。  




4. [次へ]をクリックし、データベースサービス名データベースタイプを選択し、エンドポイントデータベース名など必須フィールドに値を入力して、クラウドデータベース接続を設定します。

5. データベース接続で認証が必要な場合は、ユーザー名パスワードも入力できます。

6. 一意の接続名を入力します。

7. データベースサーバーが SSL による暗号化通信に対応している場合は、SSL を使用チェックボックスを選択できます。

8. [接続]ボタンをクリックします。
    


9. クラウドデータベースへの接続が正常に完了したら、データのエクスポート方法とエクスポート先を選択できます。

10. 既存のテーブルにデータをエクスポートする場合は、既存のテーブルを選択し、データベース内のテーブル一覧からテーブルを選択します。既存のテーブルオプションを選択した場合、新しい行をテーブルに追加する方法は 2 通りあります。
  1. 新しい行をテーブルに追加する場合は、追加を選択します。
  2. 新しい行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。


11. 新しいテーブルを作成してデータをエクスポートする場合は、新しいテーブルオプションを選択し、スキーマ名テーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: スキーマ名は必須項目ではありません。
  1. 新しい行をテーブルに追加する場合は、追加を選択します。
  2. 新しい行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ: スケジュール実行バックフィル実行の場合、最初のエクスポートは新しいテーブルに対して行われ、その後のエクスポートでは同じテーブルが既存のテーブルとして扱われます。ターゲットマッチが成功したタイミングでデータがエクスポートされます。パイプラインを実行した後にターゲットマッチエラーを確認することも、パイプラインビルダーページから直接ステージを開いて確認することもできます。


12. [保存]をクリックします。送信先を追加したら、まずは手動実行でパイプラインを実行してみてください。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプの詳細はこちらをご覧ください。

Info: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得したデータに対して、各ステージで設定した一連の変換が適用され、その後データが送信先にエクスポートされます。この一連の処理はすべてジョブページに記録されます。

13. 手動実行がエラーなく成功すると、データは正常にエクスポートされます。クラウドデータベース内の既存テーブルにデータをエクスポートしていて、手動実行時に次のようなターゲットマッチエラーが発生した場合は、ターゲットマッチングの手順を完了して修正できます。

ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐための、DataPrep の便利な機能です。

メモ: スケジュール実行 オプションを使用して新しいテーブルにデータをエクスポートし、パイプラインを自動化する場合でも、ターゲットマッチングは適用されます。最初のスケジュール実行時のみ新しいテーブルとして扱われますが、その後のエクスポートでは新しいテーブルは既存テーブルとして扱われ、ターゲットマッチングが適用されます。
 




クラウドデータベースへのエクスポート時のターゲットマッチング

ターゲットマッチングは、データが宛先にエクスポートされる前に実行されます。ターゲットマッチングは、データモデルの不一致によるエラーが原因で発生するエクスポート失敗を防ぐ、DataPrep の便利な機能です。ターゲットマッチングを使用すると、必要なクラウドデータベースのテーブルをターゲットとして設定し、ソースデータセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

メモ: ターゲットマッチングの失敗は、エクスポートの失敗ではありません。ターゲットマッチングは、データが実際に宛先へエクスポートされる前に実行されます。この段階で、エクスポート失敗の原因となり得るスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぎます。

ターゲットマッチチェックが失敗した場合

1. エクスポート中にターゲットマッチチェックが失敗した場合は、DataPrep Studioページに移動し、右上隅のターゲットマッチングアイコンをクリックし、ターゲットを表示オプションを選択します。ターゲットのデータモデルが、既存のソースデータセットの上部に表示されます。ソースデータセット内の列は、該当する場合、自動的にターゲットデータセットの列に合わせて整列されます。




ターゲットマッチングでは、一致している列と一致していない列に対して、さまざまなアイコンや提案が表示されます。これらの提案をクリックして、既存の列をターゲット列に合わせるための変更をすばやく行うことができます。エラーを簡単に修正できるように、クラウドデータベース内のターゲットタブが、データのターゲットとして関連付けられます。DataPrep Studioページでは、テーブルとのマッピングと、不一致がある箇所のエラーをあわせて確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして各エラーを解消できます。

メモ: すべての列は、デフォルトでグリッドに表示されます。ただし、すべての列リンクをクリックして、必要なオプションに絞り込むことができます。
2. サマリーを表示リンクをクリックすると、ターゲットマッチエラーのサマリーを確認できます。サマリーには、さまざまなモデルマッチエラーと、それぞれのエラーに関連付けられている列数が表示されます。必要なエラー列をクリックし、適用をクリックして、特定のエラー列だけに絞り込むことができます。



ターゲットマッチエラーのサマリー

  1. [ターゲットマッチエラー]セクションには、エラーの種類と、それぞれのエラーに関連付けられている列数が表示されます。
  2. 上部のセクションには、エラーカテゴリーと、それぞれのカテゴリーに含まれるエラー数が一覧表示されます。
  3. 各カテゴリーをクリックすると、そのカテゴリーに関連するエラーだけをパネル内に絞り込んで表示できます。
  4. デフォルトビューでは、すべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳しく確認したり、エラーのみを表示チェックボックスを選択してエラー列のみを表示したりできます。
  5. ターゲットマッチエラーのサマリーで行ったフィルターの選択内容は、DataPrep Studioページのグリッドにも適用されます。

ターゲットマッチングのエラー

ターゲットマッチングで発生するエラーは、次のとおりです。
  1. 未一致の列: このオプションでは、ソースとターゲットで一致していないすべての列が表示されます。

    メモ:
    1. ターゲット側で必須ではない列は、ソース列が存在する場合はマッチさせることも、無視することもできます。
    2. ソースに存在し、ターゲットに存在しない列は、エクスポートを続行するには、マッチさせるか削除する必要があります。

    未一致の列オプションを使用する場合は、必須列のみを表示オプションを切り替えて、必須列(ターゲットで必須に設定されている列)があるかどうかを確認し、含めることができます。必須列のみを修正して、そのままエクスポートを続行することも可能です。


  1. データ型の不一致: このオプションでは、ソース側の列のうち、ターゲット側の列とデータ型が一致していない列が表示されます。
  2. データ形式の不一致: このオプションでは、ソース側の列のうち、ターゲットと異なる日付、日時、時刻の形式を持つ列が表示されます。
  3. 制約の不一致: このオプションでは、ターゲット側の列に設定されているデータ型の制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列の不一致: このオプションでは、ターゲット側で必須に設定されているものの、ソース側では必須に設定されていない列が表示されます。

    メモ: 必須列は、マッチさせて必須に設定しない限り、宛先にエクスポートできません。列の上部にあるアイコンをクリックして、必須に設定できます。また、データ型の変更変換の必須(null 不可)として設定チェックボックスを使用して、列を必須に設定することもできます。
  5. データサイズ超過の警告: このオプションでは、ターゲットで許可されている最大サイズを超えるデータを含む列を絞り込んで表示します。

3. エラーを修正したら、パイプラインビルダーページに移動し、パイプラインを実行してデータをエクスポートします。手動実行で問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについてはこちらをご覧ください

FAQ

1. クラウドデータベースへのエクスポート時にターゲットマッチが失敗した場合、どうすればよいですか?

パイプラインの実行がターゲットマッチエラーで失敗した場合は、次の手順で修正してください。
  1. ジョブサマリーページで、右上のパイプラインを編集オプションをクリックします。パイプラインビルダーページが開きます。
      

Notes
メモ: スクリーンショットでは説明のために Zoho CRM を使用していますが、同じ操作はすべてのクラウドデータベースに適用されます。

b. 最終ステージ(クラウドデータベースを宛先として追加したステージ)を右クリックし、データを準備オプションを選択します。DataPrep Studioページが開きます。

      

c. データグリッドのすぐ上、右上隅にあるターゲットマッチングアイコンをクリックします。

d. ターゲットを表示オプションを選択します。クラウドデータベースのテーブルがターゲットとして表示され、ソース列をそれに合わせて整列できます。エラーと警告は、赤と黄色のアイコンで強調表示されます。
      
     
e. すべての列ドロップダウンをクリックし、エラー列オプションを選択します。その後、赤または黄色のアイコンをクリックして、ステージ列をクラウドデータベースの列名にマッチさせます。

これにより、ターゲットのクラウドデータベース列と一致するように、必要なデータ型と制約がステージ列に追加されます。

ターゲットとのマッピングが完了し、エラー列がなくなったら、パイプラインを実行して問題なく処理を進めることができます。


関連情報