他のクラウドサービスへのデータエクスポート - PostgreSQL

他のクラウドサービスへのデータエクスポート - PostgreSQL

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。



Zoho DataPrepは、PostgreSQLなどのOther Cloud サービスへのデータエクスポートに対応しています。PostgreSQL(Postgresとも呼ばれる)は、拡張性とSQL準拠を重視した無料かつ開く-データ元のリレーショナルデータベース管理システム(RDBMS)です。

PostgreSQLへのデータのエクスポート方法

1. 既存のパイプラインを開くか、パイプラインを作成することができますホームページ、パイプラインタブ、またはワークスペースタブから操作できます。50以上のソースからデータを取り込むことも可能です。

2. Pipeline Builderページで、データフローの作成および必要な変換を各ステージに適用した後、ステージを右クリックし、宛先を追加オプションを選択します。



3. Cloud databasesカテゴリからOther cloud サービスを選択するか、検索ボックスで検索して選択します。



Notes
メモ: 以前にPostgreSQL連携を追加済みの場合は、保存済み外部連携セクションに表示されている既存の連携を選択し、そのままエクスポートを続行できます。

4. データに個人情報が含まれる列がある場合、個人情報列セクションで、特定またはすべての個人情報列を含めるか除外するか選択できます。

必要に応じて、以下のセキュリティ対策を適用し、データ列を保護できます。

A. データマスキング  
データマスキングは、個人情報保護のために、元のデータ内容を「x」で隠します。

B. データトークナイゼーション 
データトークナイゼーションは、データ内の各異なる値をランダムな値に置き換えます。そのため、出力は統計的に元の内容のデータと同一になります。

C. なし
セキュリティ方法を使用しない場合は「なし」を選択できます。



5. 次へをクリックし、データベースサービス名のドロップダウンからPostgreSQLを選択します。

6. エンドポイントポートデータベース名ユーザー名パスワードを入力し、データベース接続を認証します。

7. データベースサーバーがSSL経由で暗号化データを提供するよう設定されている場合は、SSLを使用のチェックボックスも選択できます。

8. 接続名の欄に接続の一意な名前を入力し、接続をクリックします。
Notes
メモ: この接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
 

Notes
メモ: データベースへの接続に問題がある場合は、Zoho DataPrepのIPアドレスがアプリケーションでホワイトリストに登録されていることを確認し、クラウドデータベースへのデータエクスポートを行ってください。Zoho DataPrep IPアドレスについてはこちらをご覧ください。

9. PostgreSQLアカウントへの接続が成功したら、データをどのように、どこにエクスポートするかを選択できます。

10. データを既存テーブルにエクスポートしたい場合は、既存テーブルを選択し、データベース内で利用可能なテーブル一覧から選びます。既存テーブルオプションを選択した場合、新規行の追加方法は2つあります。
  1. 新規行をテーブルに追加する場合は、追加を選択します。
  2. 新規追加された行で既存行を置き換える場合は、ドロップダウンから上書きを選択します。


11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名テーブル名を入力し、新しい行をテーブルへどのように追加するかを選択してください。
Notes
メモ: スキーマ名は必須項目ではありません。
  1. 新しい行をテーブルに追加する場合は、追加を選択してください。
  2. 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから上書きを選択してください。
Notes
メモ: スケジュールおよびバックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、その後のエクスポートは既存テーブルに完了します。このオプションは、新しい行を既存テーブルに追加する際に使用されます。
 


12. 保存をクリックします。送信先を追加したら、まず手動実行でパイプラインを実行してみてください。手動実行が正しく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細はこちらをご参照ください。

Info
情報: 各実行はジョブとして保存されます。パイプライン実行時には、データソースから取得したデータが各ステージで申請済みの変換処理を使って加工され、その後、送信先へエクスポートされます。この一連の処理はジョブページで確認できます。

13. 手動実行がエラーなく成功すれば、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートする場合、手動実行が下記のターゲット照合エラーで失敗した場合は、ターゲット照合ステップを完了することで修正できます。

ターゲット照合は、データモデルの不一致によるエクスポート失敗を防止するDataPrepの便利な機能です。

Notes
メモ: Target matchingは、スケジュール実行オプションを使用してデータを新規テーブルにエクスポートし、パイプラインを自動化した場合でも申請済みとなります。初回のスケジュール実行時のみ新規テーブルとして扱われますが、2回目以降のエクスポートでは、その新規テーブルは既存テーブルとして扱われ、Target matchingは申請済みとなります。
 




クラウドデータベースへのエクスポート時のTarget matching

Target matchingは、データが宛先にエクスポートされる前に実行されます。Target matchingはDataPrepの便利な機能で、データモデルの不一致によるエクスポート失敗を防ぎます。Target matchingを利用すると、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルに合わせて整列できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

Notes
メモ: Target matchingの失敗は、エクスポート失敗とは異なります。Target matchingは、データが実際に宛先にエクスポートされる前に実施されます。この仕組みにより、スキーマやデータモデルのエラーでエクスポートが失敗する前に問題を検出し、エクスポート失敗を未然に防げます。

Target照合チェックが失敗した場合

1. エクスポート中にTarget照合チェックが失敗した場合、DataPrep Studioページに移動し、画面右上のTarget matchingアイコンをクリックし、表示targetオプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列に照合されます(一致する場合)。




ターゲットマッチングでは、照合済み列と未照合列に異なるアイコンや提案が表示されます。提案をクリックすることで、既存の列とターゲット列の照合作業を素早く実行できます。エラーの修正を簡単に行えるよう、クラウドデータベース内のターゲットタブがデータのターゲットとして紐付けられています。DataPrep Studioページでは、データとテーブルのマッピングおよび不一致箇所におけるエラーも確認できます。エラーアイコンにカーソルを合わせると詳細を確認でき、クリックして各エラーを解消できます。

Notes
メモ: すべての列は初期設定でグリッドに表示されますが、すべて columnsリンクをクリックして必須オプションで絞り込みが可能です。
2. 表示する 概要リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要には、モデルごとの照合エラーや各エラーに関連する列数が示されます。必須エラー列をクリックして、適用するボタンで特定のエラー列のみをフィルターできます。



ターゲット照合エラー概要

  1. ターゲット照合エラーセクションには、エラー内容と各エラーに関連する列数が表示されます。
  2. 画面上部のセクションには、エラーカテゴリーと各カテゴリー内のエラー数が一覧表示されます。
  3. それぞれをクリックすると、パネル内で該当カテゴリーのエラーのみをフィルター表示できます。
  4. 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして詳細を確認したり、表示 only errorsチェックボックスを選択してエラー列のみの表示も可能です。
  5. ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。

ターゲットマッチングエラー

ターゲットマッチング時のエラーについて、以下に説明します。
  1. 未照合列: このオプションでは、データ元とターゲットで未照合のすべての列が表示されます。
    Notes
    メモ:
    1. ターゲット側の必須でない列は、利用可能なデータ元列と照合するか、無視することができます。
    2. ターゲットに存在しないデータ元の列は、照合済みにするか、削除してエクスポートを続行してください。
    Info
    未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列のみを修正して、エクスポートを続行することも可能です。


  1. データの種類不一致: このオプションでは、データ元の列とターゲットの列のデータ型が一致しない場合に表示されます。
  2. データ形式不一致: このオプションでは、データ元の列の日付、日時、時間の形式がターゲットのものと異なる場合に表示されます。
  3. 制約不一致: このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列不一致: このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列が表示されます。
    Info
    メモ: 必須列は、照合され、かつ必須として設定されていない限り、エクスポート先にエクスポートできません。列の上にあるアイコンをクリックして必須に設定できます。また、必須(null不可)として設定チェックボックスをデータ型変更変換内で使用し、列を必須に設定することもできます。
  5. データサイズ超過警告: このオプションでは、ターゲットで許可されている最大サイズを超えるデータを含む列をフィルターします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。手動実行で正常に動作することを確認したら、スケジュールを設定してパイプラインの自動化が可能です。実行タイプの詳細は こちらをご覧ください。

他のクラウドサービス(PostgreSQL)からのデータインポート