Amazon RDS Maria DBへのデータエクスポート

お知らせ：当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrepは、クラウドデータベースであるAmazon RDSへのデータエクスポートに対応しています。Amazon RDSはAmazon Relational Database サービスとも呼ばれ、データベースの設定、運用、スケーリングを支援します。

Amazon RDS Maria DBへのデータのエクスポート方法

1. 既存のパイプラインを開くか、パイプラインの作成をホームページ、Pipelinesタブ、またはWorkspacesタブから行います。データは50以上のソースから取り込むことができます。

2. Pipeline Builderページで、データフローの作成と必要な変換の適用が完了したら、ステージを右クリックし、Destinationの追加オプションを選択します。

3. Cloud databasesカテゴリーからAmazon RDSを選ぶか、検索ボックスで検索できます。

メモ: 以前にAmazon RDS連携を追加済みの場合は、保存済み外部連携セクションの既存の連携を選択し、そのままエクスポートを続行できます。

4. データに個人情報が含まれる列がある場合は、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。

必要に応じて、下記のセキュリティ方法をデータ列に適用して保護することもできます。

A. データマスキング

データマスキングは、個人情報を保護するために、元のデータ内容を「x」で隠します。

B. データトークナイゼーション

データトークナイゼーションは、データ内の各ユニークな値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一となります。

C. なし

セキュリティ方法を使用しない場合は、「なし」を選択できます。

5. 次をクリックし、Database サービス名前ドロップダウンからMaria DBを選択します。

6. データベース接続を認証するために、Endpoint、Port、Database 名前、ユーザー名、パスワードを入力します。

7. データベースサーバーがSSL経由で暗号化データを提供するように設定されている場合は、使用する SSLのチェックボックスも選択できます。

8. Connection 名前の欄に接続の一意な名前を入力し、接続をクリックします。

メモ: 接続構成は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保管されます。

メモ: データベースへの接続に問題が発生した場合は、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリスト登録されていることを確認してください。これにより、クラウドデータベースへのデータエクスポートが可能になります。Zoho DataPrepのIPアドレスについてはこちらをご覧ください。

9. Amazon RDSアカウントへの接続が完了したら、データのエクスポート方法やエクスポート先を選択できます。

10. 既存のテーブルにデータをエクスポートしたい場合は、既存 table を選択し、データベース内で利用可能なテーブル一覧から1つ選択します。既存テーブルを選択した場合、新規行のテーブルへの追加方法は2つあります。

新規行をテーブルに追加する場合は、Appendを選択します。
新規行で既存の行を置き換える場合は、ドロップダウンからOverwriteを選択します。

11. 新しいテーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、スキーマ名とテーブル名を入力し、新しい行をテーブルにどのように追加するかを選択します。

メモ: スキーマ名は必須項目ではありません。

新しい行をテーブルに追加する場合は、追加を選択します。
新しく追加した行で既存の行を置き換える場合は、ドロップダウンから上書きを選択します。

メモ: スケジュールやバックフィル実行の場合、最初のエクスポートは新規テーブルに対して実行され、以降のエクスポートは既存テーブルに対して行われます。このオプションを使用して新しい行を既存テーブルに追加します。

12. 保存をクリックします。宛先が追加できたら、まず手動実行でパイプラインを試してみましょう。手動実行が正常に動作することを確認したら、スケジュールを設定してパイプラインを自動化できます。さまざまな実行タイプについてはこちらをご参照ください。

情報: 各実行はジョブとして保存されます。パイプラインを実行すると、データソースから取得したデータが各ステージで適用した変換処理によって準備され、その後、宛先にエクスポートされます。この一連の処理はジョブページで確認できます。

13. 手動実行がエラーなく成功した場合、データは正常にエクスポートされます。クラウドデータベースの既存テーブルにデータをエクスポートする際、手動実行時に以下のターゲット照合エラーが発生した場合は、ターゲット照合手順を完了することで修正できます。

ターゲット照合は、DataPrepで提供される便利な機能で、データモデルの不一致によるエクスポート失敗を防ぎます。

メモ: Target matchingは、データを新規テーブルへエクスポートし、Schedule runオプションでパイプラインを自動化した場合でも申請済みとなります。最初のスケジュール時のみ新規テーブルとして扱われ、その後のエクスポートでは新規テーブルは既存テーブルとして扱われ、target matchingは申請済みとなります。

クラウドデータベースへのエクスポート時のTarget matching

Target matchingは、データが宛先にエクスポートされる前に行われます。Target matchingは、DataPrepの機能で、データモデルの不一致によるエクスポート失敗を防ぐのに役立ちます。target matchingを使用すると、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元データセットの列をターゲットテーブルに合わせて照合できます。これにより、品質の高いデータをクラウドデータベースへシームレスにエクスポートできます。

メモ: Target matchingが失敗しても、必ずしもエクスポートが失敗するとは限りません。Target matchingは、データが実際に宛先にエクスポートされる前に行われます。このように、スキーマやデータモデルのエラーによるエクスポート失敗を事前に検出し、防ぐことができます。

Target照合チェックが失敗した場合

1. エクスポート中にtarget照合チェックが失敗した場合、DataPrep Studioページに移動し、右上のtarget matchingアイコン

をクリックし、表示targetオプションを選択します。ターゲットのデータモデルが既存データ元データセットの上部に表示されます。データ元データセット内の列は、ターゲットデータセットの列と一致する場合、自動的に照合されます。

Target matchingでは、照合済み・未照合の列ごとに異なるアイコンや提案が表示されます。これらの提案をクリックして、既存列とターゲット列を迅速に照合することができます。エラー修正を容易にするため、クラウドデータベース内のターゲットタブがターゲットとしてデータに紐付けられています。DataPrep Studioページで、マッピングやエラー箇所をテーブルとともに確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして個別にエラーを解消できます。

メモ: すべての列は初期設定でグリッドに表示されますが、すべての列リンクをクリックすると必須オプションでフィルター出力が可能です。

2. 表示する概要リンクをクリックすると、対象の照合エラーの概要が表示されます。概要では、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられた列数が示されます。必須エラーの列をクリックし、適用するをクリックすると、特定のエラー列のみをフィルターして出力できます。

ターゲット照合エラーの概要

ターゲット照合エラーセクションでは、エラー内容とそれぞれのエラーに関連付けられた列数が表示されます。
上部のセクションには、エラーカテゴリーごとのエラー数が一覧表示されます。
各カテゴリーをクリックすると、パネル内でそのカテゴリーに関連するエラーのみをフィルターできます。
初期表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして列を詳細に確認したり、エラーのみ表示チェックボックスを選択してエラー列のみを表示することも可能です。
ターゲット照合エラーの概要で選択したフィルター内容は、DataPrep Studioページのグリッドにも適用されます。

ターゲット照合エラー

ターゲットの照合エラーについて、以下に説明します。

未照合列：このオプションでは、データ元およびターゲット内で未照合となっているすべての列が表示されます。
メモ:
1. ターゲット内の必須でない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
2. ターゲットに存在しないデータ元の列は、照合するか、エクスポートを続行するために削除する必要があります。
未照合列オプションを使用する際は、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうかを確認し、含めることができます。また、必須列のみを修正してエクスポートを続行することも可能です。

データの種類の不一致：このオプションでは、データ元の列のうち、ターゲットの列とデータの種類が一致しないものが表示されます。
データ形式の不一致：このオプションでは、データ元の列のうち、日付、datetime、時間の形式がターゲットと異なるものが表示されます。
制約の不一致：このオプションでは、ターゲットの列のデータの種類の制約と一致しない列が表示されます。列に制約を追加する方法については、こちらをクリックしてください。
必須列の不一致：このオプションでは、ターゲットで必須として設定されているが、データ元で必須に設定されていない列が表示されます。

メモ: 必須列は、照合および必須として設定されていない限り、エクスポート先にエクスポートできません。列名の上にあるアイコンをクリックして必須に設定できます。また、必須として設定（not null）チェックボックスをデータの種類の変更変換内で使用し、列を必須に設定することもできます。
データサイズオーバーフロー警告：このオプションでは、ターゲットで許可されている最大サイズを超えるデータを持つ列をフィルタリングします。

3. エラーを修正した後、Pipeline builderページに移動し、パイプラインを実行してデータをエクスポートします。手動実行が正常に動作することを確認したら、パイプラインの自動化スケジュールを設定できます。各種実行タイプの詳細についてはこちらをご覧ください

関連情報

クラウドストレージサービスへのデータエクスポート方法

他に利用可能なクラウドデータベースは何ですか？