Zoho DataPrepは、OracleのようなOther Cloud サービスへのデータエクスポートをサポートしています。Oracleはデータの保存、整理、取得に使用されるリレーショナルデータベース管理システムです。
Oracleへのデータエクスポート方法
1.
既存のパイプラインを開くか、パイプラインを作成します。「ホーム」ページ、Pipelinesタブ、またはWorkspacesタブから実施できます。データは50以上のソースから取り込むことが可能です。
2.
Pipeline Builderページで、データフローの作成と必要な
変換を各ステージに適用した後、ステージを右クリックして
Destinationを追加オプションを選択します。
3. Cloud databasesカテゴリーからOther cloud サービスを選択するか、検索ボックスで検索できます。
メモ: 以前にOracle連携を追加済みの場合は、保存済み外部連携セクションの既存の連携を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで、含める・除外する列を一部またはすべて選択できます。
必要に応じて、下記のセキュリティ手法をデータ列に適用して保護できます。
A. データマスキング
データマスキングは個人情報を保護するため、元の内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各ユニークな値をランダムな値に置き換えます。このため、出力は元のデータと統計的に同一となります。
C. なし
セキュリティ手法を使用しない場合は「なし」を選択できます。
5. 次へをクリックし、Database サービス 名前のドロップダウンからOracleを選択します。
6. データベース接続を認証するために、Endpoint、Port、Oracle SID/サービス 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLで暗号化されたデータを提供するように設定されている場合は、使用する SSLのチェックボックスも選択できます。
8. Connection 名前に接続用の一意の名前を入力し、接続をクリックします。
メモ: 接続構成は今後データをエクスポートするために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続で問題が発生した場合は、クラウドデータベースへのデータエクスポートのため、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることをご確認ください。Zoho DataPrepのIPアドレスについては
こちらをクリックしてください。
9. Oracleアカウントへの接続が完了すると、データのエクスポート方法とエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートしたい場合は既存 tableを選択し、データベース内で利用可能なテーブルの一覧から1つ選択します。既存テーブルオプションを選択した場合、新しい行をテーブルに追加する方法は2つあります。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加される行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規 tableオプションを選択し、Schema 名前とTable 名前を入力し、新しい行をテーブルにどのように追加するかを選択します。
メモ: Schema 名前は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、Appendを選択してください。
- 新しく追加される行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択してください。
メモ:
スケジュールや
バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、2回目以降のエクスポートは既存テーブルに対して行われ、このオプションが有効な場合は新しい行が既存テーブルに追加されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインを試しに実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインの自動化が可能です。様々な実行タイプについては
こちらを参照してください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得済みのデータは、各ステージで申請済みの変換処理を通じて準備され、その後データが宛先にエクスポート済みとなります。この完了プロセスは
ジョブページに記録されます。
13. 手動実行がエラーなく完了した場合、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルにデータをエクスポートする際、手動実行で次のターゲット照合エラーが発生した場合は、ターゲットマッチング手順を完了することで修正できます。
ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防止するDataPrepの便利な機能です。
メモ:
Target matchingは、データを新規テーブルにエクスポートし、
スケジュール実行オプションを利用してパイプラインを自動化した場合でも「申請済み」となります。最初のスケジュール時のみ新規テーブルとして扱われ、その後のエクスポートでは新規テーブルが既存テーブルとして扱われるため、target matchingは「申請済み」となります。
クラウドデータベースへのエクスポート時のTarget matching
Target matchingは、データが宛先にエクスポートされる前に実行されます。DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防止します。target matchingを利用すると、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルと照合するように整列できます。これにより、クラウドデータベースへの高品質なデータのスムーズなエクスポートが実現します。
メモ: Target matchingの失敗は、エクスポートの失敗とは異なります。target matchingはデータが実際に宛先へエクスポートされる前に行われます。この仕組みにより、スキーマやデータモデルのエラーが事前に検出され、エクスポートの失敗を未然に防ぎます。
target照合チェックが失敗した場合
1. エクスポート時にtarget照合チェックが失敗した場合は、
DataPrep Studioページに移動し、右上隅のtarget matchingアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列と一致するように整列されます(一致する列が見つかった場合)。
ターゲット照合では、照合済みおよび未照合の列にさまざまなアイコンや提案が表示されます。これらの提案をクリックすることで、既存の列とターゲット列を素早く照合・修正できます。エラーの修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして関連付けられています。DataPrep Studioページで、データとテーブルのマッピングおよび不一致箇所のエラーも確認できます。エラーアイコンにマウスを重ねると詳細が表示され、クリックして個別に問題を解決できます。
メモ: 初期設定ですべての列がグリッドに表示されます。ただし、すべての列リンクをクリックすると、必須オプションで絞り込みが可能です。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、さまざまなモデルの照合エラーと各エラーに関連付けられている列数が確認できます。必須エラーの列をクリックし、適用をクリックすることで、特定のエラー列で絞り込みが可能です。
ターゲット照合エラーの概要
- ターゲット照合エラーセクションでは、エラーとそれぞれのエラーに関連する列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとにエラー数が一覧表示されます。
- 各カテゴリーをクリックすると、そのカテゴリーに関連するエラーだけをパネルで絞り込めます。
- 初期設定表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳細表示したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示することも可能です。
- ターゲット照合エラーの概要でのフィルター選択は、DataPrep Studioページのグリッドにも適用されます。
ターゲット照合エラー
ターゲットの照合エラーについて、以下に説明します。
-
未照合の列:このオプションでは、データ元およびターゲット内で未照合の列がすべて表示されます。
メモ:
- ターゲットの必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲットに存在しないデータ元の列は、照合するか削除しないと、エクスポートを続行できません。
未照合の列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須となっている列があるかどうかを確認し、必要に応じて含めてください。必須列のみ修正し、エクスポートを続行することも可能です。
- データの種類の不一致:このオプションは、データ元の列で、ターゲットの列とデータ型が一致しないものを表示します。
- データ形式の不一致:このオプションは、データ元の列のうち、日付・日時・時間の形式がターゲットと異なるものを表示します。
- 制約の不一致:このオプションは、ターゲットの列のデータ型制約と一致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列を表示します。
メモ: 必須列は、照合し必須として設定しない限り、宛先へエクスポートできません。

アイコンをクリックして、その列を必須に設定できます。
必須として設定(NULL不可)チェックボックスを
データ型変更変換で利用し、列を必須に設定することも可能です。
- データサイズ超過警告:このオプションは、ターゲットで許容される最大サイズを超えるデータがある列をフィルタします。
3. エラー修正後、
Pipeline builderページに移動してパイプラインを実行し、データをエクスポートします。手動実行が正常に動作することを確認できたら、パイプラインの自動化スケジュールを設定できます。さまざまな実行タイプについては
こちらをご参照ください。