Zoho DataPrepを使用すると、IBM Cloudというクラウドデータベースへデータのエクスポートが可能です。IBM Cloudのデータベースソリューションは、データおよび分析向けの充実したマネージドサービスを提供しています。
IBM Cloudへのデータのエクスポート手順
1. 既存のパイプラインを開くか、
パイプラインを作成します。
ホームページ、
Pipelinesタブ、または
Workspacesタブから操作できます。
50以上のソースからデータを取り込むことができます。
2.
Pipeline Builderページで、データフローの作成と必要な
変換の適用が完了したら、ステージを右クリックし、
Destinationを追加オプションを選択します。
3. Cloud databasesカテゴリーからOracle Cloudを選択するか、検索ボックスで検索して選択します。
メモ: 以前にIBM Cloud - DB2接続を追加済みの場合は、保存済み外部連携セクションから既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合は、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。
必要に応じて、下記のセキュリティ手法を適用し、データ列の保護を強化できます。
A. データマスキング
データマスキングは、個人情報の保護のため、元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各固有値をランダムな値に置き換えます。これにより、出力データは統計的に元の内容と同一となります。
C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。
5. 次をクリックし、Database サービス 名前でIBM Cloudを、Database 種類のドロップダウンでDB2を選択します。
6. データベース接続を認証するために、Endpoint、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLによる暗号化データの提供に設定されている場合は、使用する SSLのチェックボックスも選択できます。
8. Connection 名前欄に接続の一意な名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保管されます。
メモ: データベースへの接続で問題が発生した場合は、クラウドデータベースへのデータエクスポートのためにZoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されていることをご確認ください。
こちらをクリックしてZoho DataPrepのIPアドレスについてご確認いただけます。
9. IBM Cloud DB2アカウントへの接続が完了したら、データをエクスポートする方法や場所を選択できます。
10. 既存テーブルにデータをエクスポートしたい場合は、既存 tableを選択し、データベース内で利用可能なテーブル一覧から1つ選択します。既存テーブルオプションを選択した場合、新しい行をテーブルに追加する方法は2つあります。
- 新しい行をテーブルに追加する場合は、Appendを選択してください。
- 新規行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行の追加方法を選択します。
- 新しい行をテーブルに追加する場合は、追加(Append)を選択します。
- 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから上書き(Overwrite)を選択します。
メモ:
スケジュール実行や
バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、以降のエクスポートは既存テーブルに完了します。このオプションは、新しい行を既存テーブルに追加する際に使用されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインを試すことをおすすめします。手動実行が正常に動作することを確認した後、スケジュール設定でパイプラインを自動化できます。さまざまな実行タイプについては
こちらをご参照ください。
インフォメーション: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得したデータは、各ステージで申請した一連の変換処理を通じて準備され、その後宛先へエクスポートされます。この一連のプロセスは、
ジョブページで確認できます。
13. 手動実行にエラーがなければ、データは正常にエクスポートされます。クラウドデータベースの既存テーブルへデータをエクスポート中に、手動実行で下記のターゲット照合エラーが発生した場合は、ターゲットマッチング手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐDataPrepの便利な機能です。
メモ: ターゲットマッチングは、新規テーブルへのデータエクスポートや
スケジュール実行によるパイプライン自動化時にも適用されます。初回のスケジュール実行時のみ新規テーブルとして扱われますが、それ以降のエクスポートでは新規テーブルは既存テーブルとして扱われ、ターゲットマッチングが適用されます。
クラウドデータベースへのエクスポート時のターゲット照合
ターゲット照合は、データが宛先へエクスポートされる前に実行されます。DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲット照合を利用することで、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルに合わせて整列できます。これにより、高品質なデータをクラウドデータベースへスムーズにエクスポートできます。
メモ: ターゲット照合の失敗はエクスポート失敗と同じではありません。ターゲット照合はデータが実際に宛先へエクスポートされる前に実行されます。この仕組みにより、スキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を未然に防ぎます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合、
DataPrep Studioページに移動し、右上のターゲット照合アイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上に表示されます。データ元のデータセット内の列は、該当する場合、ターゲットデータセット内の列に自動で整列されます。
ターゲット照合では、照合済み列や未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列をターゲット列に素早く修正できます。エラーを簡単に修正できるよう、クラウドデータベース内のターゲットタブがデータのターゲットとして紐づけられています。DataPrep Studioページで、テーブルとのマッピングや不一致箇所のエラーを確認できます。エラーアイコンにカーソルを合わせると詳細が表示され、クリックすると各エラーの解決が可能です。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして必須オプションでフィルターすることができます。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では各種モデル照合エラーと、それぞれのエラーに関連する列数を確認できます。必要なエラー列をクリックし、適用をクリックすることで、特定のエラー列のみをフィルターして表示できます。
Target 照合する エラー 概要
- Target 照合する エラーのセクションでは、各エラーおよび関連付けられた列の番号が表示されます。
- 画面上部のセクションには、エラーカテゴリーごとにエラーの件数が一覧表示されます。
- 各カテゴリーをクリックして、そのカテゴリーに関連するエラーのみをパネルでフィルタリングできます。
- 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックすると該当する列を詳しく確認できます。また、エラーのみ表示のチェックボックスを選択すると、エラーのある列だけを表示することも可能です。
- Target 照合する エラー 概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
Target matching errors
ターゲットのマッチングエラーについて、以下のとおり説明します。
-
未照合列:このオプションでは、データ元およびターゲットで照合されていないすべての列が表示されます。
メモ:
- ターゲット側の任意列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元側の列は、照合するか削除してエクスポートを続行してください。
未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列のみを修正してエクスポートを続行することも可能です。
- データの種類不一致:このオプションは、データ元の列でターゲットの列とデータの種類が一致しないものを表示します。
- データ形式不一致:このオプションは、データ元の列で日付、datetime、時間の形式がターゲットと異なるものを表示します。
- 制約不一致:このオプションは、ターゲットの列のデータの種類制約と一致しない列を表示します。列に制約を追加する方法は、こちらをクリックしてください。
-
必須列不一致:このオプションは、ターゲットで必須に設定されているのに、データ元で必須に設定されていない列を表示します。
メモ: 必須列は、照合されかつ必須に設定されていない限り、宛先にエクスポートできません。列の上にある

アイコンをクリックして必須に設定できます。また、
必須として設定(not null)チェックボックスを
データの種類変更変換の下で使用して、列を必須に設定することも可能です。
- データサイズ超過警告:このオプションは、ターゲットで許可されている最大サイズを超えているデータを持つ列をフィルタリングします。
3. エラーを修正した後、
パイプラインビルダーページに移動し、パイプラインを実行してデータをエクスポートします。
手動実行が正常に動作することを確認したら、パイプラインの自動化のためにスケジュールを設定できます。各種実行タイプについてはこちらをご参照ください。