Zoho DataPrep は、Maria DB のような Other Cloud サービスへのデータエクスポートに対応しています。Maria DB はデータをテーブルに格納する 開く-データ元 リレーショナルデータベース管理システム(RDBMS)です。
Maria DB へのデータエクスポート方法
2.
Pipeline Builderページで、データフローの作成と必要な
変換を各ステージに適用した後、ステージを右クリックし、
Destination を追加を選択します。
3. Cloud databasesカテゴリからOther cloud サービスを選択するか、検索ボックスで検索します。
メモ: 以前に Maria DB 接続を追加している場合は、保存済み外部連携セクションから既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合は、個人情報列セクションで一部またはすべての列を含めるか除外することができます。
必要に応じて、下記のセキュリティ手法を適用し、データ列を保護することも可能です。
A. データマスキング
データマスキングは、個人情報を保護するために元の内容を「x」で隠します。
B. データトークナイゼーション
データのトークナイゼーションは、データ内の各異なる値をランダムな値に置き換えます。そのため、出力は元の内容データと統計的に同一となります。
C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。
5. 次へをクリックし、Database サービス名ドロップダウンからMaria DBを選択します。
6. データベース接続を認証するため、エンドポイント、ポート、データベース名、ユーザー名、パスワードを入力してください。
7. データベースサーバーがSSL経由で暗号化データを提供するように設定されている場合は、SSLを使用のチェックボックスも選択できます。
8. 接続名欄に接続用の一意な名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続で問題が発生した場合は、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されているかご確認ください。クラウドデータベースへのデータエクスポートの際に必要です。
こちらからZoho DataPrepのIPアドレスについてご確認いただけます。
9. Maria DBアカウントへの接続が完了したら、データのエクスポート方法やエクスポート先を選択できます。
10. 既存テーブルにデータをエクスポートしたい場合は、既存テーブルを選択し、データベース内の利用可能なテーブル一覧から選択してください。既存テーブルを選んだ場合、新しい行をテーブルに追加する方法は2通りあります。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 追加された行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をどのようにテーブルへ追加するかを選択します。
メモ: スキーマ名は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、追加を選択します。
- 新しく追加された行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ:
スケジュールや
バックフィル実行の場合、最初のエクスポートは新規テーブルに対して行われ、以降のエクスポートは既存テーブルに対して行われます。このオプションは新しい行を既存テーブルに追加する際に利用されます。
12.
保存をクリックします。宛先を追加したら、まず手動実行でパイプラインの動作を確認してみましょう。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細は
こちらをご覧ください。
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得したデータは各ステージで申請した一連の変換処理が適用され、その後宛先へエクスポートされます。この一連の処理は
ジョブページで確認できます。
13. 手動実行がエラーなく完了した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートする際、下記のターゲット照合エラーが発生し手動実行が失敗した場合は、ターゲット照合ステップを完了することで修正できます。
ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。
メモ: 新規テーブルにデータのエクスポートを行い、
スケジュール実行オプションでパイプラインを自動化した場合でも、ターゲットマッチングは申請済みとなります。最初のスケジュール実行時のみ新規テーブルとして扱われますが、その後のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲットマッチングは申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが送信先にエクスポートされる前に実行されます。DataPrep の便利な機能であり、データモデルの不一致によるエクスポート失敗を防止します。ターゲットマッチングを利用することで、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルに合わせて揃えることができます。これにより、高品質なデータをクラウドデータベースへスムーズにエクスポートできます。
メモ: ターゲットマッチングの失敗は、エクスポートの失敗とは異なります。ターゲットマッチングは、データが実際に送信先にエクスポートされる前に行われます。この仕組みにより、スキーマやデータモデルのエラーを事前に検出し、エクスポート失敗を未然に防ぎます。
ターゲット照合チェックが失敗した場合
1. エクスポート時にターゲット照合チェックが失敗した場合は、
DataPrep Studio ページに移動し、右上のターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセットの列は、自動的にターゲットデータセットの列に合わせて整列されます(一致する場合)。
ターゲットマッチングでは、照合済み列と未照合列に異なるアイコンや提案が表示されます。これらの提案をクリックすると、既存の列とターゲット列を素早く照合することができます。エラーを修正しやすくするために、クラウドデータベース内のターゲットタブがデータのターゲットとして関連付けられています。DataPrep Studioページでは、データとテーブルのマッピングおよび不一致箇所のエラーが表示されます。エラーアイコンにカーソルを合わせることで問題の内容を確認でき、クリックして個別にエラーを解決できます。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして必須オプションだけをフィルターで抽出することができます。
2. 概要を表示リンクをクリックして、ターゲット照合エラーの概要を表示します。概要には、さまざまなモデル照合エラーと、各エラーに関連付けられている列数が表示されます。必須エラーの列をクリックし、適用をクリックすることで、特定のエラー列だけをフィルターで抽出できます。
ターゲット照合エラー概要
- ターゲット照合エラーのセクションでは、エラーと各エラーに関連する列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとのエラー数が一覧表示されます。
- それぞれをクリックすると、パネル内で各カテゴリーに関連するエラーだけをフィルターで表示できます。
- 初期設定表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示したりできます。
- ターゲット照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
ターゲットマッチングエラー
ターゲットマッチングにおけるエラーは以下の通りです。
-
未照合列:このオプションでは、データ元およびターゲットで未照合のすべての列が表示されます。
メモ:
- ターゲット側で必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- ターゲット側に存在しないデータ元の列は、照合するか削除しないとエクスポートを続行できません。
未照合列のオプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるか確認し、含めることができます。必須列のみを修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列で、ターゲットの列とデータの種類が一致しないものが表示されます。
- データ形式の不一致:このオプションでは、データ元の列で、日付・日時・時間の形式がターゲットのものと異なるものが表示されます。
- 制約の不一致:このオプションでは、ターゲットの列のデータの種類の制約に合致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須になっていない列が表示されます。
メモ: 必須列は、照合されて必須に設定されていない限り、宛先へエクスポートできません。列の上部にある

アイコンをクリックして必須に設定できます。また、
必須(null不可)として設定チェックボックスを
データの種類の変更トランスフォームで利用して列を必須に設定することも可能です。
- データサイズ超過警告:このオプションでは、ターゲットで許容される最大サイズを超えるデータが含まれる列をフィルターします。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行が正常に動作することを確認したら、パイプラインの自動化のためにスケジュールを設定できます。さまざまな実行タイプについては
こちらをご覧ください。