Zoho DataPrepは、Db2などのOther Cloud サービス(IBMが開発したデータベースサーバーを含むデータ管理商品群)へのデータエクスポートに対応しています。
DB2へのデータエクスポート方法
1.
既存のパイプラインを開くか、パイプラインを作成します。「ホーム」ページ、Pipelinesタブ、またはWorkspacesタブから操作可能です。50以上のソースからデータを取り込むこともできます。
2.
Pipeline Builderページで、データフローの作成と必要な
変換処理を各ステージに適用した後、ステージを右クリックして
Destinationの追加オプションを選択します。
3. Cloud databasesカテゴリーからOther cloud サービスを選択するか、検索ボックスで検索できます。
メモ: 以前にDB2の接続を追加している場合は、保存済み外部連携セクションで既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。
データ列の保護のため、以下のセキュリティ手段を適用することも可能です。
A. データマスキング
データマスキングでは、個人情報保護のため、元の内容を「x」で非表示にします。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各異なる値をランダムな値に置き換えます。そのため、出力は元の内容データと統計的に同一です。
C. なし
セキュリティ手法を使用しない場合は、なし を選択できます。
5. 「Other Cloud サービス」をDatabase サービス 名前ドロップダウンリストで選択し、「DB2Database 種類」を選択します。
6. データベース接続を認証するために、エンドポイント、ポート、Database 名前、ユーザー名、パスワード を入力します。
7. データベースサーバーがSSL経由で暗号化データを提供するよう設定されている場合は、使用する SSL チェックボックスも選択できます。
8. Connection 名前欄に接続の一意な名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化して保存されます。
メモ: データベース接続に問題が発生した場合は、クラウドデータベースへのデータエクスポートのために、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることをご確認ください。Zoho DataPrepのIPアドレスについては
こちらをクリックしてください。
9. DB2アカウントに正常に接続済みの場合、データのエクスポート方法とエクスポート先を選択できます。
10. 既存 table を選択すると、データを既存のテーブルにエクスポートできます。データベース内の利用可能なテーブルの一覧から1つ選びます。既存テーブルオプションを選択した場合、新規行をテーブルに追加する方法を2つから選択できます。
- 新規行をテーブルに追加する場合は、Append を選択します。
- 新規に追加された行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。
11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規 table オプションを選択し、Schema 名前とTable 名前を入力し、新規行をどのようにテーブルに追加するかを選択します。
メモ: Schema 名前は必須項目ではありません。
- 新規行をテーブルに追加する場合は、Append を選択します。
- 新規に追加された行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。
メモ:
スケジュール実行や
バックフィル実行では、最初のエクスポートは新規テーブルに対して行われ、以降のエクスポートは既存テーブルに対して実行されます。このオプションは、新規行を既存テーブルに追加するために使用されます。
12.
保存 をクリックします。宛先が追加されたので、まず手動実行でパイプラインの動作を確認することをおすすめします。手動実行で問題がなければ、スケジュールを設定してパイプラインの自動化が可能です。各種実行タイプについては
こちら をご参照ください。
Info: 各実行はジョブとして保存されます。パイプラインが実行されると、データソースから取得したデータは各ステージで申請した変換処理が適用され、その後宛先にエクスポートされます。この一連の処理は
ジョブ ページで確認できます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポート済みとなります。クラウドデータベース内の既存テーブルへデータをエクスポートする際、もし手動実行が下記のターゲット照合エラーで失敗した場合は、ターゲットマッチング手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。
メモ: パイプラインを自動化し、データを新規テーブルへエクスポートする場合も、ターゲットマッチングは申請済みとなります。
スケジュール実行オプションを利用した際、最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルは既存テーブルとして扱われ、ターゲットマッチングが申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先へエクスポート済みとなる前に行われます。ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。ターゲットマッチングを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、元のデータセットの列をターゲットテーブルの列に照合できます。これにより、クラウドデータベースへ高品質なデータをスムーズにエクスポートできます。
メモ: ターゲットマッチングの失敗は、エクスポートの失敗と同じではありません。ターゲットマッチングは実際にデータが宛先へエクスポート済みとなる前に行われます。このため、スキーマやデータモデルのエラーを事前に検出し、エクスポート失敗を未然に防ぎます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合は、
DataPrep Studioページへ移動し、右上隅にあるターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存の元データセットの上部に表示されます。元データセット内の列は、自動的にターゲットデータセット内の対応する列に照合されます(該当する場合)。
ターゲット照合では、照合済み列および未照合列にさまざまなアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列とターゲット列を素早く照合できます。エラーを修正しやすくするために、クラウドデータベース内のターゲットタブがデータにターゲットとして紐づけられています。DataPrep Studioページでは、データとテーブルのマッピングおよび不一致箇所のエラーを確認できます。エラーアイコンにカーソルを合わせると詳細が表示され、クリックすると個別にエラーを解決できます。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして必須オプションのみをフィルタリングすることも可能です。
2. 概要を表示リンクをクリックして、ターゲット照合エラーの概要を表示します。概要では、さまざまなモデル照合エラーと各エラーに関連する列数が示されます。必須エラー列をクリックし、適用をクリックすることで、特定のエラー列のみをフィルタリングできます。
ターゲット照合エラー概要
- ターゲット照合エラーセクションでは、各エラーとそれに関連付けられた列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとのエラー数が一覧で表示されます。
- それぞれをクリックすることで、パネル内でカテゴリーごとのエラーをフィルタリングできます。
- 初期設定の表示では、すべての列が表示されていますが、任意のエラーカテゴリーをクリックして各列を詳しく確認したり、エラーのみ表示のチェックボックスを選択してエラー列だけを表示したりできます。
- ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
ターゲット照合エラー
ターゲットマッチングにおけるエラーについて、以下の通り説明します。
-
未照合列: このオプションでは、データ元とターゲットで未照合となっているすべての列が表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元の列は、照合するか削除しないとエクスポートを続行できません。
未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列だけを修正し、エクスポートを続行することも可能です。
- データの種類の不一致: このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものを表示します。
- データ形式の不一致: このオプションでは、データ元の列のうち、日付・日時・時間のフォーマットがターゲットと異なるものを表示します。
- 制約の不一致: このオプションでは、ターゲットの列のデータ型制約と一致しない列を表示します。列に制約を追加する方法については、こちらをご参照ください。
-
必須列の不一致: このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列を表示します。
メモ: 必須列は、照合された上で必須として設定されていない限り、宛先にエクスポートできません。上記の

アイコンをクリックして、その列を必須に設定できます。また、
必須(NULL不可)として設定のチェックボックスを、
データの種類を変更トランスフォーム内で使用し、列を必須に設定することもできます。
- データサイズ超過の警告: このオプションでは、ターゲットで許容されている最大サイズを超えている列のみをフィルタリングして表示します。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行で正常に動作することを確認したら、スケジュール設定を行いパイプラインの自動化を行ってください。さまざまな実行タイプについては
こちらをご参照ください。