Microsoft Azure MySQLへのデータエクスポート

Microsoft Azure MySQLへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrepは、クラウドデータベースカテゴリーにおいてMicrosoft Azureへのデータエクスポートをサポートしています。Azureはマイクロソフトが運営するクラウドコンピューティングプラットフォームで、アプリケーションやサービスのアクセス、管理、開発を提供します。

Microsoft Azure MySQLへのデータエクスポート方法

1. 既存のパイプラインを開くか、パイプラインを作成します。ホームページ、Pipelinesタブ、またはWorkspacesタブから操作できます。50以上のソースからデータを取り込むことも可能です。

2. Pipeline Builderページで、データフローの作成と必要な変換の適用が完了したら、任意のステージを右クリックし、Destinationの追加オプションを選択します。


3. Cloud databasesカテゴリーからMicrosoft Azureを選択するか、検索ボックスで検索できます。


Notes
メモ: すでにMicrosoft Azure接続を追加済みの場合は、保存済み外部連携セクションの既存接続を選択し、そのままエクスポートを続行できます。
4. データに個人データを含む列がある場合は、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。

個人データ列を保護するため、以下のセキュリティ手法も適用可能です。

A. データマスキング  
データマスキングは個人情報を保護するため、元のデータ内容を「x」で隠します。

B. データトークナイゼーション 
データトークナイゼーションは、データ内の各固有値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一となります。

C. なし
セキュリティ手法を使用しない場合は「なし」を選択できます。



5. 次へをクリックし、Database サービス 名ドロップダウンからMicrosoft Azureを、Database 種類ドロップダウンからMySQLを選択します。

6. データベース接続を認証するために、Server 名PortDatabase 名ユーザー名パスワードを入力します。

7. データベースサーバーがSSL経由で暗号化データを提供するように設定されている場合は、SSLを使用のチェックボックスも選択できます。

8. Connection 名に接続の一意の名前を入力し、接続をクリックします。
Notes
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保存されます。



Notes
メモ: データベースへの接続に問題が発生した場合は、クラウドデータベースへのデータエクスポートが可能となるよう、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されているかご確認ください。

9. クラウドデータベースへの接続が完了したら、データのエクスポート方法とエクスポート先を選択できます。

10. 既存のテーブルへデータをエクスポートする場合は、既存テーブルを選択し、データベース内の利用可能なテーブルの一覧から1つ選択してください。既存テーブルオプションを選んだ場合、新しい行をテーブルに追加する方法を2つから選択できます。
  1. 新しい行をテーブルに追加する場合は、追加を選択します。
  2. 新規追加行で既存の行を置き換える場合は、ドロップダウンから上書きを選択してください。


11. 新規テーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、スキーマ名およびテーブル名を入力し、新しい行をテーブルにどのように追加するかを選択します。
Notes
メモ: スキーマ名は必須項目ではありません。
  1. 新しい行をテーブルに追加する場合は、追加を選択します。
  2. 新しく追加した行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。
Notes
メモ: スケジュール実行バックフィル実行の場合、最初のエクスポートは新規テーブルに完了し、その後のエクスポートは既存テーブルに完了します。このオプションを利用して、新規行を既存テーブルに追加できます。
 


12. 保存をクリックします。宛先を追加したら、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認できたら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについてはこちらを参照してください。

Info
情報: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得したデータは、各ステージで申請した一連の変換処理により準備され、その後宛先にエクスポートされます。この一連のプロセスはジョブページで確認できます。

13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルへデータをエクスポートする場合、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲットマッチング手順を完了することで修正できます。

ターゲットマッチングは、データモデルの不一致によるエクスポート失敗を防ぐためのDataPrepの便利な機能です。

Notes
メモ: Target matchingは、データを新規テーブルにエクスポートし、スケジュール実行を利用してパイプラインを自動化した場合でも、申請済みとなります。最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、Target matchingは申請済みとなります。
 




クラウドデータベースへのエクスポート時のTarget matching

Target matchingは、データが宛先にエクスポートされる前に実行されます。DataPrepの便利な機能であり、データモデルの不一致によるエクスポートの失敗を防ぐことができます。Target matchingを利用すると、目的のクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルに合わせて揃えることができます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

Notes
メモ: Target matchingの失敗は、エクスポートの失敗と同じ意味ではありません。Target matchingは、データが実際にエクスポートされる前に実行されます。この仕組みにより、スキーマやデータモデルのエラーが事前に検出され、エクスポートの失敗を未然に防ぐことができます。

Target照合チェックが失敗した場合

1. エクスポート時にTarget照合チェックが失敗した場合は、DataPrep Studioページに移動し、右上のTarget matchingアイコンをクリックし、ターゲットを表示オプションを選択してください。ターゲットのデータモデルが既存のデータ元データセットの上部に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列と一致するように揃えられます(一致する列がある場合)。




Target matchingでは、一致した列や未一致の列に対して、さまざまなアイコンや提案が表示されます。提案部分をクリックすることで、既存の列とターゲット列を素早く一致させることが可能です。エラーの修正を容易にするため、クラウドデータベース内のターゲットタブがデータのターゲットとして紐付けられています。DataPrep Studioページで、テーブルとのマッピング状況や不一致箇所のエラーを確認することができます。エラーアイコンにカーソルを合わせると問題の詳細が表示され、クリックして個別にエラーを解決できます。

Notes
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして、必須オプションで絞り込み表示することも可能です。
2. 表示する 概要リンクをクリックすると、対象の照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーおよび各エラーに関連付けられている列数が表示されます。必須エラーの列をクリックし、適用するをクリックすると、特定のエラー列に絞り込んで出力できます。



Target 照合エラー概要

  1. Target照合エラーのセクションには、エラーおよび各エラーに関連付けられている列数が表示されます。
  2. 画面上部のセクションには、エラーカテゴリーごとにエラー数が一覧表示されます。
  3. 各カテゴリーをクリックすると、パネル内でそのカテゴリーに関連するエラーのみをフィルタリングして表示できます。
  4. 初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして各列の詳細を確認したり、エラーのみ表示のチェックボックスを選択することでエラー列だけを表示することも可能です。
  5. Target照合エラー概要でのフィルター選択は、DataPrep Studioページのグリッドにも反映されます。

Target照合エラー

Target照合エラーの詳細は以下の通りです。
  1. 未一致の列: このオプションは、データ元とターゲットで一致していないすべての列を表示します。

    Notes
    メモ:
    1. ターゲット側の必須でない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
    2. ターゲットに存在しないデータ元の列は、照合するか、エクスポートを続行するために削除する必要があります。

    Info
    未一致の列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須として設定されている列があるかどうか確認し、含めることができます。また、必須列のみ修正してエクスポートを続行することも可能です。


  1. データの種類の不一致: このオプションは、データ元の列のうち、ターゲットの列とデータ型が一致しないものを表示します。
  2. データ形式の不一致: このオプションは、データ元の列のうち、日付・日時・時間の形式がターゲットと異なるものを表示します。
  3. 制約の不一致: このオプションは、ターゲットの列のデータ型制約と一致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列の不一致: このオプションは、ターゲットで必須に設定されているが、データ元では必須に設定されていない列を表示します。

    Info
    メモ: 必須列は、照合済みかつ必須として設定されていなければ、宛先にエクスポートできません。列を必須に設定するには、上記のアイコンをクリックできます。また、必須(not null)として設定チェックボックスをデータ型を変更トランスフォーム内で使用して必須に設定できます。
  5. データサイズ超過警告: このオプションは、ターゲットで許容されている最大サイズを超えるデータを含む列をフィルターします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートできます。手動実行が正常に動作することを確認したら、パイプラインの自動化スケジュールを設定することも可能です。さまざまな実行タイプについてはこちらをご参照ください