Microsoft Azure SQL Databaseへのデータエクスポート

Microsoft Azure SQL Databaseへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrep では、クラウドデータベースカテゴリとして Microsoft Azure へのデータエクスポートをサポートしています。Azure は、アプリケーションやサービスへのアクセス、管理、開発を提供する、Microsoft が運営するクラウドコンピューティングプラットフォームです。

Microsoft Azure SQL Database にデータをエクスポートする手順

1. 既存のパイプラインを開くか、パイプラインを作成し、ホームページ、パイプラインタブ、またはワークスペースタブから操作します。データは50 以上のソースから取り込むことができます。

2. パイプラインビルダーページで、データフローの作成と各ステージで必要な変換の適用が完了したら、ステージを右クリックして[出力先を追加]オプションを選択します。


3. [クラウドデータベース]カテゴリからMicrosoft Azureを選択するか、検索ボックスで検索します。


Notes
メモ: すでに Microsoft Azure への接続を追加済みの場合は、[保存済み接続]セクションから既存の接続を選択し、そのままエクスポートを続行できます。
4. データに個人データを含む列がある場合は、[PII 列]セクションで、それらの一部またはすべてを含めるか除外するかを選択できます。

また、個人データ列を保護するために、以下のセキュリティ方式を適用できます。

A. データマスキング  
データマスキングでは、個人情報を保護するために元のデータを「x」でマスクします。

B. データトークナイゼーション 
データトークナイゼーションでは、データ内の各固有値をランダムな値に置き換えます。そのため、出力は統計的には元のデータと同一になります。

C. なし
いずれのセキュリティ方式も使用しない場合は、[なし] を選択します。



5. [次へ]をクリックし、[データベースサービス名]のドロップダウンでMicrosoft Azureを、[データベースタイプ]のドロップダウンでMySQLを選択します。

6. データベース接続を認証するために、サーバー名ポートデータベース名ユーザー名パスワードを入力します。

7. データベースサーバーが SSL による暗号化通信を行うよう設定されている場合は、[SSL を使用]チェックボックスを選択できます。

8. [接続名]に一意の名前を入力し、[接続]をクリックします。
Notes
メモ: 接続設定は、今後のデータエクスポート用に保存されます。認証情報は安全に暗号化されて保存されます。



Notes
メモ: データベースへの接続で問題が発生する場合は、クラウドデータベースにデータをエクスポートできるよう、Zoho DataPrep の IP アドレスがご利用のアプリケーションでホワイトリストに登録されていることを確認してください。

9. クラウドデータベースへの接続に成功したら、データのエクスポート方法とエクスポート先を選択できます。

10. 既存のテーブルにデータをエクスポートする場合は、[既存のテーブル]を選択し、データベース内のテーブル一覧から 1 つ選択します。[既存のテーブル]オプションを選択した場合、新しい行をテーブルに追加する方法は 2 通りあります。
  1. 新しい行をテーブルに追加する場合は、[追加]を選択します。
  2. 新しい行で既存の行を置き換える場合は、ドロップダウンから[上書き]を選択します。


11. 新しいテーブルを作成してデータをエクスポートする場合は、[新しいテーブル]オプションを選択し、スキーマ名テーブル名を入力し、新しい行をテーブルに追加する方法を選択します。
Notes
メモ: スキーマ名は必須項目ではありません。
  1. 新しい行をテーブルに追加する場合は、[追加]を選択します。
  2. 新しい行で既存の行を置き換える場合は、ドロップダウンから[上書き]を選択します。
Notes
メモ: スケジュール実行およびバックフィル実行の場合、最初のエクスポートは新しいテーブルに対して行われ、その後のエクスポートは既存のテーブルに対して行われます。このオプションは、既存テーブルに新しい行を追加する際に使用されます。


12. [保存]をクリックします。出力先を追加したら、まずは手動実行でパイプラインを実行してみることをお勧めします。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。実行の種類についてはこちらをご覧ください。

Info
Info: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得されたデータに対して、各ステージで適用した一連の変換が実行され、その後データが出力先にエクスポートされます。この一連の処理はすべて[ジョブ]ページに記録されます。

13. 手動実行がエラーなく成功すると、データは正常にエクスポートされます。クラウドデータベース内の既存テーブルにデータをエクスポートしていて、手動実行時に以下のターゲットマッチエラーが発生した場合は、ターゲットマッチングの手順を完了することで修正できます。

ターゲットマッチングは、データモデルの不一致によるエラーが原因で発生するエクスポート失敗を防ぐ、DataPrep の便利な機能です。

Notes
メモ: スケジュール実行オプションを使用して、新しいテーブルにデータをエクスポートしつつパイプラインを自動化する場合でも、ターゲットマッチングは適用されます。最初のスケジュール実行時のみ新しいテーブルとして扱われますが、その後のエクスポートでは、そのテーブルは既存テーブルとして扱われ、ターゲットマッチングが適用されます。
 




クラウドデータベースへのエクスポート時のターゲットマッチング

ターゲットマッチングは、データが宛先にエクスポートされる前に実行されます。ターゲットマッチングは、データモデルの不一致によるエラーが原因で発生するエクスポート失敗を防ぐ、DataPrep の便利な機能です。ターゲットマッチングを使用すると、必要なクラウドデータベースのテーブルをターゲットとして設定し、ソースデータセットの列をターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

Notes
メモ: ターゲットマッチングの失敗は、エクスポートの失敗ではありません。ターゲットマッチングは、データが実際に宛先へエクスポートされる前に実行されます。この段階で、エクスポート失敗の原因となり得るスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぎます。

ターゲットマッチチェックが失敗した場合

1. エクスポート中にターゲットマッチチェックが失敗した場合は、DataPrep Studioページに移動し、右上のターゲットマッチングアイコン をクリックして、[ターゲットを表示]オプションを選択します。ターゲットのデータモデルが、既存のソースデータセットの上部に表示されます。ソースデータセット内の列は、該当する場合、自動的にターゲットデータセットの列に合わせて整列されます。




ターゲットマッチングでは、一致している列と一致していない列に対して、さまざまなアイコンや候補が表示されます。これらの候補をクリックして、既存の列をターゲット列に合わせるための変更を素早く行うことができます。エラーを修正しやすくするために、クラウドデータベース内のターゲットタブが、データのターゲットとして関連付けられます。DataPrep Studioページでは、テーブルとのマッピングと、不一致がある箇所のエラーをあわせて確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして各エラーを解消できます。

Notes
メモ: すべての列は、デフォルトでグリッドに表示されます。ただし、[すべての列]リンクをクリックして、必要なオプションに絞り込むことができます。
2. [サマリーを表示]リンクをクリックすると、ターゲットマッチエラーの概要を確認できます。サマリーには、さまざまなモデルマッチエラーの種類と、それぞれに該当する列数が表示されます。必要なエラー列をクリックし、[適用]をクリックすると、特定のエラー列だけを絞り込めます。



ターゲットマッチエラーのサマリー

  1. [ターゲットマッチエラー]セクションには、エラーの種類と、それぞれに該当する列数が表示されます。
  2. 上部のセクションには、エラーカテゴリと各カテゴリ内のエラー数が一覧表示されます。
  3. 各カテゴリをクリックすると、そのカテゴリに関連するエラーだけをパネル内に絞り込めます。
  4. デフォルトビューでは、すべての列が表示されますが、任意のエラーカテゴリをクリックして列を詳しく確認したり、[エラーのみ表示]チェックボックスを選択してエラー列だけを表示したりできます。
  5. [ターゲットマッチエラーのサマリー]で行ったフィルターの選択内容は、DataPrep Studioページのグリッドにも適用されます。

ターゲットマッチングのエラー

ターゲットマッチングで発生するエラーは、次のとおりです。
  1. 未一致の列: このオプションでは、ソースとターゲットで一致していないすべての列が表示されます。

    Notes
    メモ:
    1. ターゲット側で必須ではない列は、ソース列が存在する場合はマッチさせることも、無視することもできます。
    2. ソースに存在し、ターゲットに存在しない列は、エクスポートを続行するには、マッチさせるか削除する必要があります。

    Info
    [未一致の列]オプションを使用する場合は、[必須列のみ表示]オプションを切り替えて、必須列(ターゲット側で必須に設定されている列)があるかどうかを確認し、含めることができます。必須列のみを修正して、そのままエクスポートを続行することも可能です。


  1. データ型の不一致: このオプションでは、ソース側のデータ型がターゲット側の列と一致していない列が表示されます。
  2. データ形式の不一致: このオプションでは、ソース側の列の日時(日付、日時、時刻)形式が、ターゲット側と異なる列が表示されます。
  3. 制約の不一致: このオプションでは、ターゲット側の列に設定されているデータ型の制約と一致しない列が表示されます。列に制約を追加する方法については、こちらを参照してください。
  4. 必須列の不一致: このオプションでは、ターゲット側で必須に設定されているものの、ソース側では必須に設定されていない列が表示されます。

    Info
    メモ: 必須列は、マッチさせて必須に設定しない限り、宛先にエクスポートできません。列の上にある アイコンをクリックして、その列を必須に設定できます。また、データ型の変更変換の[必須(null 不可)に設定]チェックボックスを使用して、列を必須に設定することもできます。
  5. データサイズ超過の警告: このオプションでは、ターゲットで許可されている最大サイズを超えるデータを含む列が絞り込まれます。

3. エラーを修正したら、パイプラインビルダーページに移動し、パイプラインを実行してデータをエクスポートします。手動実行で問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプの詳細はこちらをご覧ください。