Zoho DataPrepは、クラウドデータベースであるAmazon Athenaからのデータインポートに対応しています。Athenaは、Amazon シンプル Storage サービス(Amazon S3)に保存された非構造化、半構造化、構造化データを分析できるインタラクティブなクエリサービスです。
Amazon Athenaからデータをインポートする方法
1.
パイプラインを作成 または既存のパイプラインを ホーム ページ、 Pipelines タブ、または Workspaces タブから開き、 データを追加 オプションをクリックします。または、 データをインポート オプションを Workspaces タブの下でクリックしてデータをインポートできます。
情報: データをインポート アイコンをパイプラインビルダー画面右上でクリックすると、複数のソースからパイプラインにデータを取り込むことができます。
2. 左ペインのCloud databasesカテゴリを選択し、Amazon Athenaをクリックします。検索ボックスでAmazon Athenaを検索することもできます。
メモ: すでにAthena連携を追加済みの場合は、保存済み外部連携カテゴリから必要な連携を選択し、インポートを続行してください。保存済み外部連携の詳細については、こちらをクリックしてください。
3. Database サービス 名前ドロップダウンでAmazon Athenaを選択します。
4. 接続したいAthenaデータベースのAWSリージョンとDatabase 名前を入力します。
5. クエリ結果を保存するAmazon S3場所のパスを入力してください。パスの先頭にはS3を付けてください。
6. Database 名前、Connection 名前、ユーザー名、パスワードを入力して、データベース接続を認証します。
メモ: Connection 名前は各接続ごとに一意である必要があります。
7. 接続ボタンをクリックします。
メモ: 今後データをインポートするために接続設定が保存されます。認証情報は安全に暗号化されて保存されます。
8. インポートが必要なテーブルを選択します。
9. SQLクエリを使用して、データを選択およびインポートすることも可能です。
クエリを使用してデータベースからインポートする場合、増分フェッチオプションは利用できません。こちらをクリックして、クラウドデータベースからの増分フェッチの詳細をご確認ください。
10. インポートするをクリックして、Athenaアカウントからのデータインポートを開始します。
11. データのインポートが完了すると、 Pipeline builder ページが開き、トランスフォームの適用を開始できます。ステージを右クリックし、 Prepare data オプションを選択することで、 DataPrep Studio ページでさまざまなトランスフォームを使ってデータを準備できます。 こちらをクリック すると、トランスフォームの詳細をご覧いただけます。
12
. データフローの作成および各ステージで必要な変換の適用が完了したら、ステージを右クリックして宛先を追加してデータフローを完了できます。
メモ: パイプラインへの宛先追加後、まず手動実行でパイプラインを実行し、正常に動作することを確認してください。手動実行で問題がなければ、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細はこちらをご覧ください。
スケジュール、バックフィル、手動更新、Webhook、またはZoho Flowの設定時には、すべてのソースに対してインポート設定が必須となります。インポート設定を行わないと、実行を保存できません。インポート設定方法の詳細は
こちらをクリックしてご確認ください。
13.
実行の設定後、パイプラインジョブがその実行時に作成されます。ジョブのステータスや詳細は、Job概要で確認できます。こちらをクリックすると、Job概要の詳細をご覧いただけます。
情報: Amazon Athena へのデータエクスポートはサポートしていません。
Amazon Athena 接続の編集方法
DataPrep では、データの外部連携情報を保存しておくことで、毎回認証情報を入力する手間を省けます。保存済みのデータ連携は、編集 connection オプションからいつでも編集・更新し、新しいパラメーターや認証情報を追加できます。
1. 新しいデータセットを作成する際、データ元を選択ボックスから保存済み外部連携をクリックします。
2. データインポート画面から保存済み外部連携を管理できます。省略記号アイコンをクリックすると、連携の共有・編集・概要の表示・削除が行えます。
3. 編集 connection オプションをクリックして、新しいパラメーターや認証情報で保存済み連携を更新します。