Microsoft Azure Maria DBへのデータエクスポート
お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Zoho DataPrepは、クラウドデータベースカテゴリー内でMicrosoft Azureへのデータエクスポートに対応しています。Azureはマイクロソフトが運営するクラウドコンピューティングプラットフォームで、アプリケーションやサービスへのアクセス、管理、開発を提供しています。
Microsoft Azure Maria DBへのデータエクスポート方法
1. 既存のパイプラインを開くか、
パイプラインを作成します。
ホームページ、
Pipelinesタブ、または
Workspacesタブから操作できます。
50種類以上のソースからデータを取り込むことが可能です。
2.
Pipeline Builderページで、データフローの作成と必要な
変換処理を各ステージに適用した後、ステージを右クリックし、
宛先を追加オプションを選択します。
3. Cloud databasesカテゴリーからMicrosoft Azureを選択するか、検索ボックスで検索して選択します。
メモ: 以前にMicrosoft Azureの接続を追加している場合は、保存済み外部連携セクションから既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべてを含める、もしくは除外するかを選択できます。
必要に応じて、以下のセキュリティ手法を適用し、個人情報列を保護できます。
A. データマスキング
データマスキングは個人情報を保護するために、元のデータを「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内の各固有値をランダムな値に置き換えます。そのため、出力は統計的に元のデータと同一になります。
C. なし
セキュリティ手法を使用しない場合は「なし」を選択できます。
5. 次をクリックし、Database サービス 名前のドロップダウンからMicrosoft Azureを選択し、Database 種類のドロップダウンからMaria DBを選択します。
6. データベース接続を認証するために、Server 名前、Port、Database 名前、ユーザー名、パスワードを入力します。
7. データベースサーバーがSSLによる暗号化データの提供に設定されている場合は、使用する SSLのチェックボックスも選択できます。
8. Connection 名前に接続の一意な名前を入力し、接続をクリックします。
メモ: この接続設定は今後のデータエクスポート用に保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続に問題が発生した場合は、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されていることを確認してください。これによりクラウドデータベースへのデータエクスポートが可能となります。
9. クラウドデータベースへの接続が正常に完了したら、データのエクスポート方法とエクスポート先を選択できます。
10. 既存のテーブルにデータをエクスポートする場合は既存 tableを選択し、データベース内の利用可能なテーブル一覧から一つを選びます。既存テーブルを選択した場合、新しい行の追加方法は2つあります。
- 新しい行をテーブルに追加する場合は、Appendを選択します。
- 新しく追加される行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。
11. 新規テーブルを作成してデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名およびテーブル名を入力し、新規行をテーブルにどのように追加するかを選択します。
メモ: スキーマ名は必須項目ではありません。
- 新規行をテーブルに追加する場合は、追加を選択します。
- 追加した新規行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
メモ:
スケジュールおよび
バックフィル実行の場合、最初のエクスポートは新規テーブルに対して実施され、その後のエクスポートは既存テーブルに対して実施されます。このオプションは、新規行を既存テーブルに追加する際に利用されます。
12.
保存をクリックします。宛先を追加したので、まず手動実行でパイプラインを実行してみましょう。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについては
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得されたデータは、各ステージで適用した一連の変換処理を経て準備され、その後、宛先にエクスポートされます。この一連の処理は
ジョブページに記録されます。
13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベース内の既存テーブルにデータをエクスポートしている場合、手動実行で以下のターゲット照合エラーが発生した場合は、ターゲット照合ステップを完了させることで修正できます。
ターゲット照合は、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。
メモ: 新規テーブルへのデータのエクスポート後、
スケジュール実行オプションを使用してパイプラインを自動化しても、ターゲットマッチングは申請済みとなります。初回のスケジュール時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲットマッチングは申請済みとなります。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先にエクスポートされる前に実行されます。DataPrepのターゲットマッチング機能は、データモデルの不一致によるエクスポート失敗を防ぐために役立ちます。ターゲットマッチングを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルに合わせて整列させることができます。これにより、高品質なデータをシームレスにクラウドデータベースへエクスポートできます。
メモ: ターゲットマッチングの失敗はエクスポートの失敗とは異なります。ターゲットマッチングは、データが実際にエクスポートされる前に実行されます。この仕組みにより、スキーマやデータモデルのエラーによるエクスポートの失敗を事前に検出し、エクスポート失敗を防止します。
ターゲット照合チェックが失敗した場合
1. エクスポート時にターゲット照合チェックが失敗した場合は、
DataPrep Studioページへ移動し、右上のターゲットマッチングアイコン

をクリックし、
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセットの列は、自動的にターゲットデータセットの列に合わせて整列されます(一致が見つかった場合)。
ターゲットマッチングでは、照合済み列と未照合列に応じて異なるアイコンや提案が表示されます。提案をクリックすることで、既存列とターゲット列を迅速に一致させる修正が可能です。エラー修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐づけられます。DataPrep Studioページで、テーブルとのマッピングや不一致がある箇所のエラー内容を確認できます。エラーアイコンにカーソルを合わせると問題の詳細が表示され、クリックして個別にエラーを解決できます。
メモ: 初期設定では、すべての列がグリッドに表示されますが、すべての列リンクをクリックして必須オプションのみをフィルター出力することもできます。
2. 表示する 概要リンクをクリックすると、対象の照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーや、各エラーに関連付けられているカラム数が確認できます。必要なエラーカラムをクリックし、適用するをクリックすると、特定のエラーカラムのみを絞り込んで表示できます。
Target照合エラー概要
- Target照合エラーセクションでは、エラーおよび各エラーに関連付けられているカラム数が表示されます。
- 画面上部には、エラーカテゴリーごとにエラー数が一覧表示されます。
- 各カテゴリーをクリックすると、パネル内でそのカテゴリーに関連するエラーのみを絞り込めます。
- 初期表示ではすべてのカラムが表示されますが、任意のエラーカテゴリーをクリックしてカラムを詳細に確認したり、エラーのみ表示チェックボックスを選択することでエラーカラムのみを表示できます。
- Target照合エラー概要で選択したフィルターは、DataPrep Studioページのグリッドにも適用されます。
Target照合エラー
Target照合エラーの内容については、以下で説明します。
-
不一致の列: このオプションでは、データ元とターゲットで一致しないすべての列が表示されます。
メモ:
- ターゲット内の必須でない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
- ターゲットに存在しないデータ元の列は、照合するか、エクスポートを続行するために削除する必要があります。
不一致の列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうかを確認し、それらを含めることができます。必須列のみ修正して、エクスポートを続行することも可能です。
- データの種類の不一致: このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものが表示されます。
- データ形式の不一致: このオプションでは、データ元の列のうち、日付、datetime、時間の形式がターゲットと異なるものが表示されます。
- 制約の不一致: このオプションでは、ターゲットの列のデータ型制約に一致しない列が表示されます。列に制約を追加する方法については、こちらをご参照ください。
-
必須列の不一致: このオプションでは、ターゲットで必須に設定されているが、データ元では必須になっていない列が表示されます。
メモ: 必須列は、照合されて必須に設定されていない限り、宛先にエクスポートできません。列を必須に設定するには、上記の

アイコンをクリックします。また、
必須に設定(null不可)チェックボックスを
データの種類を変更トランスフォーム内で利用して、列を必須に設定することもできます。
- データサイズ超過の警告: このオプションでは、ターゲットで許可された最大サイズを超えるデータを含む列がフィルタリングされます。
3. エラーを修正した後、
Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行で問題がないことを確認したら、スケジュール設定を行いパイプラインを自動化することも可能です。各種実行方法については
こちらをご覧ください