Rackspace Cloud Maria DBへのデータエクスポート

Rackspace Cloud Maria DBへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。



Zoho DataPrepは、データのエクスポートをRackspace Cloud Maria DBへ行うことができます。Rackspace Cloud Maria DBは、OpenStack®クラウド上に構築されたAPIベースのスタンドアロン型リレーショナルデータベースサービスであり、Rackspaceの顧客が複数のMySQLデータベースインスタンスを簡単にプロビジョニングおよび管理できるようにします。

データのエクスポート方法 Rackspace Cloud Maria DBへ  

 

1. 既存のパイプラインを開くか、新規パイプラインを作成します。「ホーム」ページ、「パイプライン」タブ、または「ワークスペース」タブから操作できます。データは50以上のソースから取り込むことが可能です。

2. Pipeline Builderページで、データフローの作成と必要な変換処理を各ステージに適用したら、ステージを右クリックし、宛先を追加オプションを選択します。

 

3. Cloud databasesカテゴリーからRackspace Cloud Maria DBを選択するか、検索ボックスで検索して選択できます。

 


Notesメモ:以前に Rackspace Cloud Maria DB 接続を追加済みの場合は、「保存済み外部連携」セクションから既存の接続を選択し、そのままエクスポートを続行できます。

4. データに個人情報を含む列がある場合、「個人情報列」セクションで一部またはすべての列を含めるか除外するかを選択できます。


また、データ列を保護するために、以下の必要なセキュリティ手法を適用できます。

A. データマスキング  
データマスキングは、個人情報を保護するためにデータの元の内容を「x」で隠します。

B. データトークナイゼーション 
データトークナイゼーションは、データ内のそれぞれの異なる値をランダムな値に置き換えることで、出力結果が元の内容のデータと統計的に同一になるようにします。

C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。


 

5. 次へをクリックし、 RackspaceDatabase サービス 名前のドロップダウンから選択し、Maria DBDatabase 種類で選択します。

 

6. 認証に必要なEndpointPortDatabase 名前ユーザー名およびパスワードを入力します。


7. データベースサーバーがSSLを利用して暗号化データを提供するように設定されている場合は、使用するSSL チェックボックスを選択してください。

8. 接続の名前 欄に一意な名前を入力し、接続をクリックします。

Notes
メモ: 今後データをエクスポートする際のために、接続の構成が保存されます。認証情報は安全に暗号化されて保存されます。



Notesメモ: データベースへの接続に問題が発生した場合は、アプリケーションでZoho DataPrepのIPアドレスがホワイトリストに登録されていることを確認してください。これにより、クラウドデータベースへのデータのエクスポートが可能です。 こちらをクリックして、Zoho DataPrepのIPアドレスをご確認ください。

9. Rackspace Cloud Maria DBへの接続が成功したら、データのエクスポート方法とエクスポート先を選択できます。

 

10. データを既存 tableへエクスポートする場合は、「既存 table」を選択し、データベース内で利用可能なテーブル一覧から1つ選択してください。

 

11. 「既存 table」オプションを選択すると、DataPrepのデータセットから新規行をデータベース内のテーブルにエクスポートする方法を2つから選べます。

 

  • 新規行をテーブルに追加する場合は、「Append」を選択してください。

 

 

  • 新しく追加した行で既存の行を置き換える場合は、Overwriteをドロップダウンから選択してください。

 


 

12. 新規テーブルを作成してデータをエクスポートしたい場合は、新規 table オプションを選択し、Schema 名前Table 名前 を入力してエクスポートを続行してください。


Notes
メモ:Schema 名前は必須項目ではありません。


13. 保存をクリックします。宛先を追加した後、まず手動実行でパイプラインを試しに実行してみてください。手動実行が正常に動作することを確認できれば、スケジュールを設定してパイプラインの自動化が可能です。実行の種類についてはこちらをご参照ください。

Info
情報: 各実行はジョブとして保存されます。パイプライン実行時、データソースから取得済みのデータは、各ステージで申請済みの変換処理を通じて準備され、その後宛先へエクスポート済みとなります。この一連のプロセスはジョブページで確認できます。

14. 手動実行がエラーなく成功した場合、データは正常にエクスポート済みとなります。クラウドデータベースの既存テーブルへデータをエクスポートする場合、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲット照合手順を完了することで修正できます。

Target matching(ターゲット照合)は、データモデルの不一致によるエクスポートする失敗を防ぐDataPrepの有用な機能です。

Notes
メモ: ターゲット照合は、データのエクスポート先が新規テーブルの場合や、スケジュール実行オプションでパイプラインを自動化する場合でも申請済みとなります。初回のスケジュール実行時のみ新規テーブルとして扱われ、以降のエクスポートでは新規テーブルが既存テーブルとして扱われ、ターゲット照合が申請済みとなります。
 




クラウドデータベースへのエクスポート時のターゲット照合について

ターゲット照合は、データが宛先へエクスポート済みとなる前に実行されます。ターゲット照合は、データモデルの不一致によるエクスポートする失敗を防ぐDataPrepの有用な機能です。ターゲット照合を利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルと照合することができます。これにより、高い品質のデータをクラウドデータベースにシームレスにエクスポートできます。

Notes
メモ: ターゲット照合の失敗はエクスポートする失敗と同じではありません。ターゲット照合は、データが実際に宛先へエクスポート済みとなる前に実行されます。この仕組みにより、エクスポートする際に失敗の原因となるスキーマやデータモデルエラーを事前に検出し、エクスポートする失敗を未然に防ぎます。

ターゲット照合チェックが失敗した場合

1. エクスポート時にターゲット照合チェックが失敗した場合、DataPrep Studioページに移動し、右上のターゲット照合アイコンをクリックし、ターゲットを表示オプションを選択します。ターゲットのデータモデルが既存データ元データセットの上部に表示されます。データ元データセット内の列は、自動的にターゲットデータセットの列と照合され、一致する場合は自動で揃えられます。




ターゲット照合では、照合済み列および未照合列に対して異なるアイコンや提案が表示されます。提案をクリックすると、既存列とターゲット列の照合を素早く変更できます。エラーを修正しやすくするため、クラウドデータベース内のターゲットタブがデータのターゲットとして関連付けられています。DataPrep Studioページでテーブルとのマッピングや、不一致がある箇所のエラーもあわせて確認できます。エラーアイコンにカーソルを合わせることで問題の内容が分かり、クリックして個別にエラーを解決できます。

Notes
メモ: すべての列は初期設定でグリッドに表示されます。ただし、すべての列リンクをクリックして必須オプションのみをフィルター出力することも可能です。
2. 概要を表示リンクをクリックすると、ターゲット照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられた列の数が示されます。必須エラー列をクリックし、適用するをクリックすると、特定のエラー列のみをフィルター出力できます。



ターゲット照合エラーの概要

  1. ターゲット照合エラーのセクションでは、エラー内容と、それぞれのエラーに関連付けられた列の数が表示されます。
  2. 上部のセクションには、エラーカテゴリーごとのエラー件数が一覧で表示されます。
  3. それらをクリックすることで、パネル内で各カテゴリーに関連するエラーのみをフィルターできます。
  4. 初期設定の表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして、該当する列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラー列だけを表示することも可能です。
  5. ターゲット照合エラーの概要でのフィルター選択は、DataPrep Studioページのグリッドにも適用されます。

ターゲット照合エラー

ターゲットマッチングにおけるエラーの内容は以下の通りです。
  1. 未照合列:このオプションでは、データ元およびターゲット内の未照合列がすべて表示されます。
    Notes
    メモ:
    1. ターゲット側の必須ではない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
    2. ターゲット側に存在しないデータ元の列は、照合するか削除してエクスポートを続行してください。
    Info
    未照合列オプションを利用する際は、必須列のみ表示オプションの切り替えでターゲット側で必須に設定されている列があるか確認し、必要に応じて含めることができます。必須列のみを修正してエクスポートを続行することも可能です。


  1. データの種類不一致:このオプションでは、データ元の列でターゲットの列とデータ型が一致しないものが表示されます。
  2. データ形式不一致:このオプションでは、データ元の列で日付、日時、時間形式がターゲットと異なるものが表示されます。
  3. 制約不一致:このオプションでは、ターゲットの列のデータ型制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
  4. 必須列の不一致:このオプションでは、ターゲットで必須に設定されているが、データ元で必須に設定されていない列が表示されます。
    Info
    メモ:必須列は、照合および必須に設定されていない限り、宛先へエクスポートできません。列の上部にあるアイコンをクリックして必須に設定できます。また、データ型変更トランスフォームの必須(null不可)に設定チェックボックスを使用して、列を必須に設定することも可能です。
  5. データサイズ超過警告:このオプションでは、ターゲットで許可される最大サイズを超えたデータを含む列をフィルタリングします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。 手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。各実行タイプの詳細については、こちらをご覧ください。



 

関連情報

Rackspace Maria DBからZoho DataPrepへデータをインポートする方法