Zoho DataPrepは、SingleStore(旧MemSQL)のようなOther Cloud サービスへのデータエクスポートに対応しています。SingleStoreは分散型リレーショナルSQLデータベース管理システム(RDBMS)であり、ANSI SQLサポートを備えています。データの取り込み、取引処理、クエリ処理の高速性で知られています。
MemSQLへのデータのエクスポート方法
1.
既存のパイプラインを開くか、パイプラインの作成をホームページ、Pipelinesタブ、またはWorkspacesタブから行います。50以上のソースからデータを取り込むことができます。
2.
Pipeline Builderページで、データフローの作成と各ステージへの必要な
変換が完了したら、ステージを右クリックし、
Destinationを追加オプションを選択します。
3. Cloud databasesカテゴリからOther cloud サービスを選択するか、検索ボックスで検索して選択できます。
メモ: 以前にMemSQL連携を追加している場合は、保存済み外部連携セクションで既存の連携を選択し、そのままエクスポートを続行できます。
4. データに個人情報を含む列がある場合は、個人情報列セクションで、含める・除外する列を選択できます(一部またはすべて)。
必要に応じて、以下のセキュリティ手法を適用してデータ列を保護できます。
A. データマスキング
データマスキングは、個人情報を保護するために元の内容データを「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションは、データ内のそれぞれの異なる値をランダムな値に置き換え、出力が統計的に元の内容データと同一であることを保証します。
C. なし
セキュリティ方法を使用しない場合は「なし」を選択できます。
5. 「Other Cloud サービス」を Database サービス 名前ドロップダウンで選択し、 MemSQL Database 種類を選択します。
6. Endpoint、Port、Database 名前、ユーザー名、パスワードを入力し、データベース接続を認証します。
7. データベースサーバーがSSLを使用して暗号化されたデータを提供するように設定されている場合は、使用する SSLチェックボックスも選択できます。
8. Connection 名前欄に接続用の一意の名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保存されます。
メモ: データベースへの接続で問題が発生した場合は、Zoho DataPrepのIPアドレスがアプリケーションで許可リストに登録されていることを確認し、クラウドデータベースへのデータのエクスポートを有効にしてください。
こちらでZoho DataPrepのIPアドレスについてご確認いただけます。
9. MemSQL アカウントに正常に接続できたら、データをどのように、またどこにエクスポートするかを選択できます。
10. データを既存のテーブルにエクスポートしたい場合は 既存 table を選択し、データベース内で利用可能なテーブルの一覧から一つ選択します。既存テーブルのオプションを選択した場合、新しい行をテーブルに追加する方法として2つの選択肢があります。
- 新しい行をテーブルに追加する場合は、Append を選択します。
- 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。
11. 新しいテーブルを作成してデータをエクスポートしたい場合は、新規 table オプションを選択し、Schema 名前 と Table 名前 を入力し、新しい行をテーブルに追加する方法を選択します。
メモ: Schema 名前は必須項目ではありません。
- 新しい行をテーブルに追加する場合は、Append を選択します。
- 新しく追加する行で既存の行を置き換える場合は、ドロップダウンから Overwrite を選択します。
メモ:
スケジュール や
バックフィル 実行の場合、最初のエクスポートは新規テーブルに完了し、以降のエクスポートは既存テーブルに完了します。このオプションは新しい行を既存テーブルに追加する際に使用されます。
12.
保存 をクリックします。宛先を追加したら、最初に手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。異なる実行タイプの詳細は
こちらをご参照ください。
情報: 各実行はジョブとして保存されます。パイプライン実行が行われると、データソースから取得したデータに対し各ステージで申請済みの変換処理が実行され、その後データが宛先にエクスポートされます。この一連のプロセスは
ジョブページに記録されます。
13. 手動実行がエラーなく成功すると、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルにデータをエクスポートする際、手動実行が以下のターゲット照合エラーで失敗した場合は、ターゲットマッチング手順を完了させることで修正できます。
ターゲットマッチングは、DataPrepにおいてデータモデルの不一致によるエクスポート失敗を防ぐ便利な機能です。
メモ: ターゲットマッチングは、新規テーブルにデータのエクスポートを行い、
スケジュール実行オプションでパイプラインを自動化する場合でも適用されます。最初のスケジュール実行時のみ新規テーブルとして扱われますが、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲットマッチングが適用されます。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先にエクスポート済みになる前に実行されます。DataPrepのターゲットマッチング機能は、データモデルの不一致によるエクスポート失敗を防ぐのに役立ちます。ターゲットマッチングを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルと照合して整列させることができます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。
メモ: ターゲットマッチングの失敗は、エクスポート失敗とは異なります。ターゲットマッチングは、実際にデータが宛先にエクスポート済みとなる前に行われます。この仕組みにより、エクスポート失敗につながるスキーマやデータモデルのエラーを事前に検出し、エクスポートの失敗を防ぐことができます。
ターゲット照合チェックが失敗した場合
1. エクスポート中にターゲット照合チェックが失敗した場合、
DataPrep Studio ページに移動し、右上のターゲットマッチングアイコン

をクリックして
ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存のデータ元データセットの上に表示されます。データ元データセットの列は、自動的にターゲットデータセットの列と照合して整列されます(該当する場合)。
ターゲット照合は、照合済みおよび未照合の列に異なるアイコンと提案を表示します。これらの提案をクリックすることで、既存の列とターゲット列を迅速に照合できます。エラーの修正を容易にするため、クラウドデータベースのターゲットタブがデータに紐付けられています。DataPrep Studioページで、データとテーブルのマッピングおよび不一致がある箇所のエラーを確認できます。エラーアイコンにカーソルを合わせると問題の詳細を確認でき、クリックするとエラーを個別に解決できます。
メモ: すべての列は初期設定でグリッドに表示されます。ただし、「すべての列」リンクをクリックして必須オプションでフィルターできます。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられている列数が示されます。必須エラー列をクリックし、適用をクリックすることで、特定のエラー列のみをフィルター表示できます。
ターゲット照合エラー概要
- ターゲット照合エラーのセクションでは、エラーとそれぞれのエラーに関連付けられている列数が表示されます。
- 上部のセクションには、エラーカテゴリーごとにエラー数とともに一覧が表示されます。
- 各カテゴリーをクリックして、パネルで該当するエラーのみをフィルターできます。
- 初期設定ではすべての列が表示されますが、エラーカテゴリーをクリックすると該当列を詳しく確認したり、「エラーのみ表示」チェックボックスを選択してエラー列だけを表示したりできます。
- ターゲット照合エラー概要でのフィルター選択は、DataPrep Studioページのグリッドにも反映されます。
ターゲット照合エラー
ターゲット照合時のエラーについて説明します。
-
未照合列:このオプションでは、データ元およびターゲットで未照合のすべての列が表示されます。
メモ:
- ターゲット側で必須でない列は、利用可能な場合はデータ元の列と照合するか、無視できます。
- データ元に存在し、ターゲットにない列は照合するか、削除しないとエクスポートを続行できません。
未照合列オプションを利用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうか確認し、必要に応じて含めることができます。必須列のみ修正してエクスポートを続行することも可能です。
- データの種類の不一致:このオプションでは、データ元の列のうち、ターゲットの列とデータ型が一致しないものを表示します。
- データ形式の不一致:このオプションでは、データ元の列のうち、日付・日時・時刻のフォーマットがターゲットと異なるものを表示します。
- 制約の不一致:このオプションでは、ターゲットの列のデータ型制約に合致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列を表示します。
メモ: 必須列は、照合されて必須に設定されていない限り、エクスポート先にエクスポートできません。列を必須に設定するには、上記の

アイコンをクリックしてください。また、
必須として設定(not null)チェックボックスを
データ型の変更トランスフォームで使用すると、列を必須に設定できます。
- データサイズ超過警告:このオプションでは、ターゲットで許容される最大サイズを超えるデータを持つ列をフィルタリングします。
3. エラーを修正した後、
パイプラインビルダーページに移動し、パイプラインを実行してデータをエクスポートします。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについては
こちらをご参照ください。