Amazon Redshiftへのデータエクスポート

Amazon Redshiftへのデータエクスポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。


Zoho DataPrepは、クラウドデータベースであるAmazon Redshiftからのデータインポートに対応しています。これは、クラウド上で完全に管理されたペタバイト規模のデータ倉庫サービスです。

データをAmazon Redshiftへエクスポートする

1. DataPrep Studioページのエクスポートメニューから今すぐエクスポートオプションをクリックします。



2. Cloud databasesカテゴリーからOracle Cloudを選択するか、検索ボックスで検索できます。


Notes
メモ: 以前にAmazon Redshift連携を追加している場合は、保存済み外部連携セクションの既存の連携を選択し、そのままエクスポートを進めることができます。

3. データに個人情報を含む列がある場合、個人情報列セクションで一部またはすべての列を含めるか除外するかを選択できます。

また、下記の必要なセキュリティ手法を適用してデータ列を保護できます。

A. データマスキング  
データマスキングでは、個人情報を保護するために元のデータ内容を「x」で隠します。

B. データトークナイゼーション 
データトークナイゼーションは、データ内のそれぞれの異なる値をランダムな値に置き換えます。そのため、出力は元のデータと統計的に同一となります。

C. なし
セキュリティ手法を利用しない場合は「なし」を選択できます。



4. をクリックし、Database サービス名ドロップダウンからAmazon Redshiftを選択します。

5. データベース接続を認証するために、エンドポイントポートデータベース名ユーザー名パスワードを入力します。

6. データベースサーバーがSSLによる暗号化データの提供に設定されている場合は、SSLを使用するのチェックボックスを選択できます。

7. 接続名に一意の名前を入力し、接続をクリックします。

Notes
メモ: 接続の設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化され、保存されます。



Notes
メモ: データベースへの接続に問題がある場合は、クラウドデータベースへデータをエクスポートするために、Zoho DataPrepのIPアドレスがご利用のアプリケーションでホワイトリストに登録されているかご確認ください。Zoho DataPrepのIPアドレスについてはこちらをクリックしてご確認いただけます。

8. Amazon Redshiftアカウントへの接続が完了したら、データのエクスポート方法とエクスポート先を選択できます。

9. データを既存テーブルにエクスポートしたい場合は、既存テーブルを選択し、データベース内の利用可能なテーブル一覧から選択します。
 
10. 既存テーブルオプションを選択した場合、DataPrepのデータセットから新規行をデータベースのテーブルにどのようにエクスポートするか、2つの方法から選べます。
 
  1. 新規行をテーブルに追加する場合は、追加を選択してください。
      
  1. 新しく追加された行で既存の行を置き換える場合は、ドロップダウンから上書きを選択してください。
      

既存テーブルオプションを選択すると、

a. エクスポートするをクリックしてエクスポートする概要を表示します。概要には、宛先、対象テーブル、エクスポートされるデータの数、ターゲット照合チェック結果などの詳細が含まれます。

b. ターゲット照合チェックに失敗した場合は、ターゲットの照合手順を完了してエラーを修正してください。ターゲット照合チェックに合格した場合は、必須のクラウドデータベースへのデータエクスポートを続行できます。

      
Info
情報 : ターゲット照合は、DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲット照合の詳細についてご参照ください。

11. 新規テーブルを作成してデータをエクスポートする場合は、新規テーブルオプションを選択し、Schema 名前Table 名前を入力してエクスポートを続行します。

Notes
メモ:Schema 名前は必須項目です。



12. エクスポートするをクリックします。

クラウドデータベースへのエクスポート時のターゲット照合

ターゲット照合は、データが宛先にエクスポートされる前に行われます。これは、DataPrepの便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲット照合を利用すると、必須クラウドデータベーステーブルをターゲットとして設定し、元データセットのカラムをターゲットテーブルに合わせて調整できます。これにより、高品質なデータをクラウドデータベースへシームレスにエクスポートできます。



Notes
メモ: Target matching failure は、エクスポート失敗とは異なります。Target matchingは、実際にデータが宛先にエクスポートされる前に行われます。これにより、エクスポート失敗の原因となるスキーマやデータモデルのエラーを事前に検知し、エクスポート時の問題を防ぐことができます。Target matching の詳細はこちら

ターゲット照合チェックが失敗した場合

1. クラウドデータベースへのエクスポート中にターゲット照合チェックが失敗した場合は、エラー詳細を表示リンクをエクスポート概要ペインからクリックすると、エラーの概要を確認できます。



2. ターゲット照合エラーパネルには、さまざまなモデル照合エラーと、それぞれのエラーに関連付けられたカラム数が表示されます。

Info
アドバイス: 初期設定ではエラーカラムのみが表示されますが、エラーのみ表示のチェックボックスをオフにすると、すべてのカラムを表示できます。

ターゲットマッチングのエラーについては、以下で説明します。

  1. 不一致の列:このオプションを選択すると、データ元とターゲットデータセットで一致していないすべての列が表示されます。

    Notes
    メモ:
    1. ターゲット側の必須でない列は、利用可能な場合はデータ元の列と照合するか、無視することができます。
    2. データ元に存在し、ターゲットに存在しない列は、照合するか削除しないとエクスポートを続けることができません。
     

    Info
    不一致の列オプションを使用している際、必須列のみ表示オプションを切り替えることで、ターゲット側で必須に設定されている列があるかどうかを確認し、それらを含めることができます。必須列のみ修正して、エクスポートを続行することも可能です。



  1. データの種類ミスマッチ: このオプションは、データ元データセットのカラムで、ターゲットのカラムとデータ型が一致しないものを表示します。
  2. Data形式ミスマッチ: このオプションは、データ元データセットのカラムで、日付、datetime、および時間の形式がターゲットデータセットと異なるものを表示します。
  3. Constraintミスマッチ: このオプションは、ターゲットのカラムのデータ型制約と一致しないカラムを表示します。カラムに制約を追加する方法については、こちらをクリックしてください。
  4. 必須カラムミスマッチ: このオプションは、ターゲットで必須として設定されているが、データ元データセットでは必須に設定されていないカラムを表示します。

    Info
    メモ: 必須カラムは、照合済みかつ必須として設定されていない限り、宛先にエクスポートできません。カラムの上部にあるアイコンをクリックして必須に設定できます。また、必須(null不可)として設定チェックボックスをデータ型変更変換で利用して、カラムを必須として設定することもできます。
  5. データサイズ超過警告: このオプションは、ターゲットで許可されている最大サイズを超えるデータを持つカラムをフィルタリングします。
Notes
メモ: データサイズ超過の注意は、データベースターゲットにのみ適用されます。



3. エラー修正ボタンを利用して、ターゲット照合エラーペインに表示されたカラムレベルの問題を修正するために、データセットに戻ることができます。

エラー修正をより簡単に行えるよう、クラウドデータベース内のターゲットタブがデータセットのターゲットとして紐付けられています。DataPrep Studioページでデータセットとテーブルのマッピング、および不一致がある箇所のエラーを確認できます。エラーアイコンにカーソルを合わせて内容を確認し、クリックして各エラーを解決できます。



  1. Target 照合する errors セクションには、エラーと各エラーに関連付けられている列の番号が表示されます。
  2. 上部のセクションでは、エラーカテゴリーごとにエラーの数が一覧表示されます。
  3. 各カテゴリーをクリックして、パネル内でそのカテゴリーに関連するエラーのみをフィルターできます。
  4. 初期設定では、すべての列が表示されますが、任意のエラーカテゴリーをクリックして該当する列を詳しく確認したり、「エラーのみ表示」のチェックボックスを選択してエラーのある列だけを表示したりできます。
  5. Target 照合する errors パネルでのフィルター選択は、DataPrep Studioページのグリッドにも適用されます。

4. エラー修正後は、データをクラウドデータベースへエクスポートする作業に進むことができます。



6. このエクスポートをスケジュールしますか?オプションを使用して、エクスポートをスケジュールすることも可能です。

 

エクスポートをスケジュールするには、
  1. 繰り返し方法(N時間ごと、毎日、週1回、月1回)を選択し、頻度を実行ドロップダウンで頻度を設定します。
  1. エクスポートするデータのタイムゾーンも選択できます。初期設定ではローカルタイムゾーンが選択されており、保存をクリックします。
こちらをクリックすると、エクスポートのスケジュール方法について詳しく確認できます。


関連情報