他のクラウドサービスへのデータエクスポート - MemSQL

他のクラウドサービスへのデータエクスポート - MemSQL

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。



Zoho DataPrepは、SingleStore(旧MemSQL)のようなOther Cloud サービスへのデータエクスポートに対応しています。SingleStoreは分散型リレーショナルSQLデータベース管理システム(RDBMS)であり、ANSI SQLサポートを備えています。データの取り込み、取引処理、クエリ処理の高速性で知られています。

MemSQLへのデータのエクスポート方法

1. 既存のパイプラインを開くか、パイプラインの作成ホームページ、Pipelinesタブ、またはWorkspacesタブから行います。50以上のソースからデータを取り込むことができます。

2. Pipeline Builderページで、データフローの作成と各ステージへの必要な変換が完了したら、ステージを右クリックし、Destinationを追加オプションを選択します。



3. Cloud databasesカテゴリからOther cloud サービスを選択するか、検索ボックスで検索して選択できます。



Notes
メモ: 以前にMemSQL連携を追加している場合は、保存済み外部連携セクションで既存の連携を選択し、そのままエクスポートを続行できます。

4. データに個人情報を含む列がある場合は、個人情報列セクションで、含める・除外する列を選択できます(一部またはすべて)。

必要に応じて、以下のセキュリティ手法を適用してデータ列を保護できます。

A. データマスキング  
データマスキングは、個人情報を保護するために元の内容データを「x」で隠します。

B. データトークナイゼーション 
データトークナイゼーションは、データ内のそれぞれの異なる値をランダムな値に置き換え、出力が統計的に元の内容データと同一であることを保証します。

C. なし
セキュリティ方法を使用しない場合は「なし」を選択できます。



5. Other Cloud サービス」を Database サービス 名前ドロップダウンで選択し、 MemSQL Database 種類を選択します。

6. EndpointPortDatabase 名前ユーザー名パスワードを入力し、データベース接続を認証します。

7. データベースサーバーがSSLを使用して暗号化されたデータを提供するように設定されている場合は、使用する SSLチェックボックスも選択できます。

8. Connection 名前欄に接続用の一意の名前を入力し、接続をクリックします。
Notes
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
 

Notes
メモ: データベースへの接続で問題が発生した場合は、Zoho DataPrepのIPアドレスがアプリケーションで許可リストに登録されていることを確認し、クラウドデータベースへのデータのエクスポートを有効にしてください。こちらでZoho DataPrepのIPアドレスについてご確認いただけます。

9. MemSQL アカウントに正常に接続できたら、データをどのように、またどこにエクスポートするかを選択できます。

10. データを既存のテーブルにエクスポートしたい場合は 既存 table を選択し、データベース内で利用可能なテーブルの一覧から一つ選択します。既存テーブルのオプションを選択した場合、新しい行をテーブルに追加する方法として2つの選択肢があります。
  1. 新しい行をテーブルに追加する場合は、Append を選択します。
  2. 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。


11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規 table オプションを選択し、Schema 名前Table 名前 を入力し、新しい行をテーブルに追加する方法を選択します。
Notes
メモ: Schema 名前は必須項目ではありません。
  1. 新しい行をテーブルに追加する場合は、Append を選択します。
  2. 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。
Notes
メモ: スケジュールバックフィル 実行の場合、最初のエクスポートは新規テーブルに完了し、以降のエクスポートは既存テーブルに完了します。このオプションは新しい行を既存テーブルに追加する際に使用されます。
 


12. 保存 をクリックします。宛先を追加したら、最初に手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。異なる実行タイプの詳細はこちらをご参照ください。

Info
情報: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得したデータに対し各ステージで申請済みの変換処理が実行され、その後データが宛先にエクスポートされます。この一連のプロセスはジョブページに記録されます。

13. 手動実行がエラーなく成功すると、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルにデータをエクスポートする際、手動実行が以下のターゲット照合エラーで失敗した場合は、ターゲットマッチング手順を完了させることで修正できます。

ターゲットマッチングは、DataPrepにおいてデータモデルの不一致によるエクスポート失敗を防ぐ便利な機能です。

Notes
メモ: ターゲットマッチングは、新規テーブルにデータのエクスポートを行い、スケジュール実行オプションでパイプラインを自動化する場合でも適用されます。最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲットマッチングが適用されます。
 




クラウドデータベースへのエクスポート時のターゲットマッチング

ターゲットマッチングは、データが宛先にエクスポート済みになる前に実行されます。DataPrepのターゲットマッチング機能は、データモデルの不一致によるエクスポート失敗を防ぐのに役立ちます。ターゲットマッチングを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルと照合して整列させることができます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。

Notes
メモ: ターゲットマッチングの失敗は、エクスポート失敗とは異なります。ターゲットマッチングは、実際にデータが宛先にエクスポート済みとなる前に行われます。この仕組みにより、エクスポート失敗につながるスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぐことができます。

ターゲット照合チェックが失敗した場合

1. エクスポート中にターゲット照合チェックが失敗した場合、DataPrep Studio ページに移動し、右上のターゲットマッチングアイコンをクリックしてターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上に表示されます。データ元データセットの列は、自動的にターゲットデータセットの列と照合して整列されます(該当する場合)。




ターゲット照合は、照合済みおよび未照合の列に異なるアイコンと提案を表示します。これらの提案をクリックすることで、既存の列とターゲット列を迅速に照合できます。エラーの修正を容易にするため、クラウドデータベースのターゲットタブがデータに紐付けられています。DataPrep Studioページで、データとテーブルのマッピングおよび不一致がある箇所のエラーを確認できます。エラーアイコンにカーソルを合わせると問題の詳細を確認でき、クリックするとエラーを個別に解決できます。

Notes
メモ: すべての列は初期設定でグリッドに表示されます。ただし、「すべての列」リンクをクリックして必須オプションでフィルターできます。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられている列数が示されます。必須エラー列をクリックし、適用をクリックすることで、特定のエラー列のみをフィルター表示できます。



ターゲット照合エラー概要

  1. ターゲット照合エラーのセクションでは、エラーとそれぞれのエラーに関連付けられている列数が表示されます。
  2. 上部のセクションには、エラーカテゴリーごとにエラー数とともに一覧が表示されます。
  3. 各カテゴリーをクリックして、パネルで該当するエラーのみをフィルターできます。
  4. 初期設定ではすべての列が表示されますが、エラーカテゴリーをクリックすると該当列を詳しく確認したり、「エラーのみ表示」チェックボックスを選択してエラー列だけを表示したりできます。
  5. ターゲット照合エラー概要でのフィルター選択は、DataPrep Studioページのグリッドにも反映されます。

ターゲット照合エラー

ターゲット照合時のエラーについて説明します。
  1. 未照合列:このオプションでは、データ元およびターゲットで未照合のすべての列が表示されます。
    Notes
    メモ:
    1. ターゲット側で必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
    2. データ元に存在し、ターゲットにない列は照合するか、削除しないとエクスポートを続行できません。
    Info
    未照合列オプションを利用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうか確認し、必要に応じて含めることができます。必須列のみ修正してエクスポートを続行することも可能です。


  1. データの種類の不一致:このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものを表示します。
  2. データ形式の不一致:このオプションでは、データ元の列のうち、日付・日時・時刻のフォーマットがターゲットと異なるものを表示します。
  3. 制約の不一致:このオプションでは、ターゲットの列のデータ型制約に合致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列を表示します。
    Info
    メモ: 必須列は、照合されて必須に設定されていない限り、エクスポート先にエクスポートできません。列を必須に設定するには、上記のアイコンをクリックしてください。また、必須として設定(not null)チェックボックスをデータ型の変更トランスフォームで使用すると、列を必須に設定できます。
  5. データサイズ超過警告:このオプションでは、ターゲットで許容される最大サイズを超えるデータを持つ列をフィルタリングします。

3. エラーを修正した後、パイプラインビルダーページに移動し、パイプラインを実行してデータをエクスポートします。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについては こちらをご参照ください。

MemSQLからデータをインポート