データをPanoplyにエクスポートする

データをPanoplyにエクスポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrepを使うと、データのエクスポートをPanoplyに行うことができます。Panoplyは、さまざまなソースからデータを同期、ストア、整理、分析できる完全統合型のデータ管理プラットフォームです。

Panoplyへのデータのエクスポート方法  

 

1. 既存のパイプラインを開くか、パイプラインを作成するには、ホームページ、Pipelinesタブ、またはWorkspacesタブから行います。50以上のソースからデータを取り込むことができます。

2. Pipeline Builderページで、データフローの作成と必要な変換の適用が完了したら、ステージを右クリックしてDestinationを追加オプションを選択します。

 

3. Cloud databasesカテゴリーからPanoplyを選択するか、検索ボックスで検索してください。


 


Notesメモ:以前にPanoplyの追加済み連携がある場合は、「保存済み外部連携」セクションから既存の連携を選択するだけで、そのままエクスポートを続けられます。


4. データに個人情報が含まれる列がある場合、「個人情報」列セクションで、一部またはすべての列を含めるか除外するかを選択できます。

 

また、下記の必要なセキュリティ方法を適用してデータ列を保護できます。

 

A. データマスキング  

データマスキングは、個人情報を保護するために、元の内容データを「x」で隠します。

 

B. データトークナイゼーション 

データトークナイゼーションは、データ内の各異なる値をランダムな値に置き換えます。そのため、出力は統計的に元の内容データと同一です。

 

C. なし

セキュリティ手法を使用しない場合は、なしを選択できます。


 

5. 次へをクリックし、PanoplyDatabase サービス 名前ドロップダウンから選択します。

 

6. EndpointPortDatabase 名前ユーザー名およびパスワードを入力し、データベース接続を認証します。

 

7. 接続に一意の名前をConnection 名前に入力し、接続をクリックします。

 

Notesメモ: 接続設定は今後データをエクスポートする際に保存されます。認証情報は安全に暗号化され、保存されます。

  

Notesメモ: データベースへの接続に問題が発生した場合は、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されているかご確認ください。クラウドデータベースへデータをエクスポートするために必要です。 こちらをクリックしてZoho DataPrepのIPアドレスについてご確認ください。

8. Panoplyアカウントへの接続が完了したら、データのエクスポート方法およびエクスポート先を選択できます。

 

9. 既存テーブルを選択すると、既存のテーブルへデータをエクスポートできます。データベース内の利用可能なテーブル一覧からテーブルを選択してください。

 

10. 既存テーブルを選択した場合、DataPrepのデータセットから新規行をデータベース内のテーブルにエクスポートする方法は2通りあります。

 

  • 新規行をテーブルに追加する場合は、Appendを選択してください。

 

 

  • 新規追加された行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択してください。

 



 

11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規テーブル オプションを選択し、スキーマ名テーブル名 を入力し、エクスポートを続行してください。


Notes
メモ:Schema 名前が次の値と等しくない場合、必須項目です。



 

12. 保存をクリックします。宛先を追加したので、まずは手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認できたら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについてはこちらをご覧ください。

Info
情報: 各実行はジョブとして保存されます。パイプライン実行が開始されると、データソースから取得したデータは各ステージで申請した一連の変換処理によって整形され、その後、宛先にエクスポートされます。この一連のプロセスはジョブページで確認できます。

13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートする際に手動実行が失敗し、下記のターゲット照合エラーが発生した場合は、ターゲット照合の手順を完了することで修正できます。

ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐ、DataPrep の便利な機能です。

Notes
メモ: ターゲット照合は、新規テーブルへのデータエクスポートや、スケジュール実行オプションでパイプラインを自動化する場合にも申請されます。最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは既存テーブルとして扱われ、ターゲット照合が適用されます。
 




クラウドデータベースへのエクスポート時のターゲット照合

ターゲット照合は、データが宛先にエクスポートされる前に実行されます。ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐ、DataPrep の便利な機能です。ターゲット照合を利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットのカラムをターゲットテーブルに照合できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

Notes
メモ: Target matching failure は、エクスポート失敗と同じではありません。Target matching は、実際にデータがエクスポート先に送信される前に行われます。これにより、スキーマやデータモデルのエラーによるエクスポート失敗を事前に検出し、エクスポート失敗を防止します。

ターゲット照合チェックが失敗した場合

1. エクスポート中にターゲット照合チェックが失敗した場合、DataPrep Studioページに移動し、右上のターゲット照合アイコンをクリックし、ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存データ元データセットの上部に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列と一致するように整列されます(該当する場合)。




ターゲット照合では、一致している列と一致していない列に異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存列とターゲット列をすばやく照合できます。エラー修正を容易にするため、クラウドデータベースのターゲットタブがデータのターゲットとして紐付けられています。DataPrep Studioページで、テーブルとのマッピングや不一致がある箇所のエラーも確認できます。エラーアイコンにカーソルを合わせると詳細を確認でき、クリックして個別のエラーを解決できます。

Notes
メモ: すべての列は初期設定でグリッドに表示されますが、すべての列リンクをクリックして必須オプションでフィルタリングすることもできます。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要を確認できます。概要では、さまざまなモデル照合エラーおよび各エラーに関連付けられている列数が表示されます。必須エラー列をクリックし、適用をクリックすると、特定のエラー列で絞り込みができます。



ターゲット照合エラー概要

  1. ターゲット照合エラーセクションでは、エラーと各エラーに関連付けられている列数が表示されます。
  2. 上部のセクションには、各カテゴリーごとのエラーカテゴリーとエラー数が一覧表示されます。
  3. 各カテゴリーをクリックすると、そのカテゴリーに関連するエラーのみをパネルでフィルタリングして表示できます。
  4. 初期表示では、すべての列が表示されますが、エラーカテゴリーをクリックすることで、該当する列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示できます。
  5. ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。

ターゲット照合エラー

ターゲットマッチングのエラーについて以下に説明します。
  1. 未照合列:このオプションでは、データ元とターゲットの未照合列すべてが表示されます。

    Notes
    メモ:
    1. ターゲット側の任意項目の列は、利用可能な場合データ元の列と照合するか、無視することができます。
    2. ターゲットに存在しないデータ元の列は、照合するか、削除してエクスポートを続行してください。

    Info
    未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、それらを含めることができます。必須列のみを修正してエクスポートを続行することも可能です。


  1. データの種類不一致:このオプションは、データ元の列のうち、ターゲットの列とデータの種類が一致しない列を表示します。
  2. データ形式不一致:このオプションは、データ元の列のうち、日付・日時・時間のフォーマットがターゲットと異なる列を表示します。
  3. 制約不一致:このオプションは、ターゲットの列に設定されているデータの種類の制約と一致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列不一致:このオプションは、ターゲットで必須に設定されているが、データ元では必須になっていない列を表示します。
    Info
    メモ: 必須列は、照合されて必須として設定されていない限り、エクスポート先にエクスポートできません。列を必須に設定するには、上記のアイコンをクリックしてください。また、必須に設定(not null)チェックボックスを「データの種類変更」トランスフォームで使用して、列を必須に設定することもできます。
  5. データサイズオーバーフロー警告:このオプションは、ターゲットで許容される最大サイズを超えたデータを持つ列をフィルターします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化することも可能です。各種実行タイプの詳細はこちらをご覧ください。


関連情報

PanoplyからZoho DataPrepへのデータインポート方法