Zoho DataPrepは、クラウドデータベースであるAmazon Redshiftからのデータインポートに対応しています。Amazon Redshiftは、クラウド上で完全に管理されたペタバイト規模のデータ倉庫サービスです。
Amazon Redshiftへのデータエクスポート
1.エクスポートメニューの今すぐエクスポートオプションをDataPrep Studioページでクリックします。
2.Cloud databasesカテゴリーからOracle Cloudを選択するか、検索ボックスで検索できます。
メモ: 以前にAmazon Redshiftの接続を追加している場合は、保存済み外部連携 セクションから既存の接続を選択し、そのままエクスポートを続行できます。
3. データに個人情報を含む列がある場合、個人情報列セクションで、それらの一部またはすべてを含めるか除外するかを選択できます。
必要なセキュリティ手法を下記から適用し、データ列を保護できます。
A. データマスキング
データマスキングは個人情報を保護するため、元のデータ内容を「x」で隠します。
B. データトークナイゼーション
データトークナイゼーションでは、各値をランダムな値に置き換えます。そのため、出力結果は元のデータと統計的に同一です。
C. なし
セキュリティ手法を使用しない場合は、「なし」を選択できます。
4.次をクリックし、Databaseサービス名ドロップダウンでAmazon Redshiftを選択します。
5.Endpoint、Port、Database名、ユーザー名、パスワードを入力し、データベース接続を認証します。
6. データベースサーバーがSSLによる暗号化データの配信に設定されている場合は、SSLを使用のチェックボックスも選択できます。
7.Connection名欄に一意の名前を入力し、接続をクリックします。
メモ: 接続設定は今後のデータエクスポートのために保存されます。認証情報は安全に暗号化されて保管されます。
メモ: データベースへの接続に問題が発生した場合は、クラウドデータベースへのデータのエクスポートを行うために、Zoho DataPrep の IP アドレスがご利用のアプリケーションでホワイトリストに登録されているかご確認ください。Zoho DataPrep の IP アドレスについては
こちらをクリックしてください。
8. Amazon Redshift アカウントへの接続が完了したら、データのエクスポート方法やエクスポート先を選択できます。
9. データを既存のテーブルにエクスポートしたい場合は 既存テーブル を選択し、データベース内で利用可能なテーブルの一覧から選択してください。
10. 既存テーブル オプションを選択した場合、DataPrep のデータセットから新しい行をデータベース内のテーブルにエクスポートする方法を2通りから選べます。
- 新しい行をテーブルに追加する場合は、追加 を選択してください。
- 新たに追加された行で既存の行を置き換える場合は、ドロップダウンから 上書き を選択してください。
a. エクスポート をクリックして エクスポート概要 を表示します。概要には、宛先、対象テーブル、エクスポートされるデータ数、ターゲット照合チェックの結果などの詳細が含まれます。
b. ターゲット照合チェックに失敗した場合は、ターゲット照合の手順を完了してエラーを修正する必要があります。ターゲット照合チェックが通過した場合は、必要なクラウドデータベースへのエクスポートを続行できます。
情報: ターゲット照合は、DataPrep で提供される便利な機能で、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲット照合の詳細については
こちらをご覧ください。
11. 新規テーブルを作成しデータをエクスポートしたい場合は、新規テーブルオプションを選択し、スキーマ名、テーブル名を入力してエクスポートを続行します。
メモ: スキーマ名は必須項目です。
12. エクスポートするをクリックします。
クラウドデータベースへのエクスポート時のターゲットマッチング
ターゲットマッチングは、データが宛先にエクスポートされる前に実行されます。DataPrep の便利な機能であり、データモデルの不一致によるエクスポート失敗を防ぎます。ターゲットマッチングを利用することで、必要なクラウドデータベーステーブルをターゲットとして設定し、データ元のデータセット列をターゲットテーブルに合わせて照合できます。これにより、高品質なデータをクラウドデータベースへスムーズにエクスポートできます。
メモ: ターゲットマッチングの失敗は、エクスポート失敗とは異なります。ターゲットマッチングは、データが実際に宛先にエクスポートされる前に行われます。このプロセスにより、スキーマやデータモデルのエラーが事前に検出され、エクスポート失敗を防ぐことができます。
ターゲットマッチングの詳細はこちら。
ターゲット照合チェックが失敗した場合
1. クラウドデータベースエクスポート時にターゲット照合チェックが失敗した場合は、エラーの詳細を表示リンクをエクスポート概要ペインからクリックして、エラーの概要を取得できます。
2. ターゲット照合エラーパネルでは、さまざまなモデル照合エラーと各エラーに関連付けられた列数が表示されます。
アドバイス: 初期表示ではエラー列のみが表示されますが、エラーのみ表示チェックボックスのチェックを外すことで、すべての列を表示できます。
ターゲットマッチングのエラー内容は以下の通りです。
-
不一致の列:このオプションは、データ元およびターゲットデータセットにおいて一致していないすべての列を表示します。
メモ:
- ターゲットの必須でない列は、利用可能な場合にはデータ元の列と照合するか、無視することができます。
- ターゲットに存在しないデータ元の列は、照合するか削除しないとエクスポートを続行できません。
不一致の列オプションを使用する際、必須列のみ表示オプションを切り替えて、ターゲットで必須に設定されている列があるかどうかを確認し、それらを含めることが可能です。必須列のみを修正してエクスポートを続行することもできます。
- データの種類の不一致:このオプションは、データ元データセットのうち、ターゲットの列とデータ型が一致しない列を表示します。
- データ形式の不一致:このオプションは、データ元データセットのうち、日付・日時・時間の形式がターゲットの列と異なる列を表示します。
- 制約の不一致:このオプションは、ターゲットの列のデータ型制約と一致しない列を表示します。列に制約を追加する方法については、こちらをクリックしてください。
-
必須列の不一致:このオプションは、ターゲットで必須に設定されているが、データ元データセットでは必須に設定されていない列を表示します。
メモ:必須列は、照合されて必須に設定されていない限り、宛先にエクスポートできません。列を必須に設定するには、上記の

アイコンをクリックしてください。また、
必須に設定(NULL不可)チェックボックスを
データ型の変更変換の下で使用し、列を必須に設定することも可能です。
- データサイズ超過警告:このオプションは、ターゲットで許可されている最大サイズを超えるデータを含む列をフィルターします。
メモ: Data size overflow 注意はデータベースターゲットにのみ適用されます。
3. Fix errorsボタンを使用して、Target 照合する errorsペインに表示される列レベルの問題を修正するために、データセットに戻ることができます。
エラーを簡単に修正できるよう、クラウドデータベース内のターゲットタブがデータセットのターゲットとして関連付けられています。DataPrep Studioページにて、データセットとテーブルのマッピング、および不一致がある箇所にはエラーも表示されます。エラーアイコンにカーソルを合わせると問題内容を確認でき、クリックして個別にエラーを解決できます。
- Target 照合する errorsセクションには、エラー内容と各エラーに関連付けられた列番号が表示されます。
- 上部のセクションには、エラーカテゴリーごとのエラー件数とともにカテゴリーが一覧表示されます。
- 各カテゴリーをクリックすると、パネル内でそのカテゴリーに関連するエラーだけをフィルターできます。
- 初期設定表示ではすべての列が表示されますが、任意のエラーカテゴリーをクリックして該当列を詳しく確認したり、エラーのみ表示チェックボックスを選択してエラーのある列だけを表示したりできます。
- Target 照合する errorsパネルでのフィルター選択は、DataPrep Studioページのグリッドにも適用されます。
4. エラー修正後は、データをクラウドデータベースへエクスポートする作業を続行できます。
6. Schedule this エクスポートする?オプションを使ってエクスポートのスケジューリングを行うこともできます。
エクスポートをスケジュールするには、
- 繰り返し方法(頻度 'N' 時間、頻度日、週1回、月1回)を選択し、Perform 頻度ドロップダウンで頻度を設定します。
- タイムゾーンを選択してデータのエクスポート先を指定できます。初期設定ではローカルタイムゾーンが選択されています。保存をクリックしてください。
こちらをクリックすると、エクスポートのスケジュールについて詳しくご覧いただけます。
関連情報