Amazon Athenaからデータをインポートする

Amazon Athenaからデータをインポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrepは、クラウドデータベースであるAmazon Athenaからのデータインポートに対応しています。Athenaは、Amazon シンプル Storage サービス(Amazon S3)に保存された非構造化、半構造化、構造化データを分析できるインタラクティブなクエリサービスです。

Amazon Athenaからデータをインポートする方法

1. パイプラインを作成 または既存のパイプラインを ホーム ページ、 Pipelines タブ、または Workspaces タブから開き、 データを追加 オプションをクリックします。または、 データをインポート オプションを Workspaces タブの下でクリックしてデータをインポートできます。
Info情報: データをインポート アイコンをパイプラインビルダー画面右上でクリックすると、複数のソースからパイプラインにデータを取り込むことができます。



2. 左ペインのCloud databasesカテゴリを選択し、Amazon Athenaをクリックします。検索ボックスでAmazon Athenaを検索することもできます。



Notesメモ: すでにAthena連携を追加済みの場合は、保存済み外部連携カテゴリから必要な連携を選択し、インポートを続行してください。保存済み外部連携の詳細については、こちらをクリックしてください。

3. Database サービス 名前ドロップダウンでAmazon Athenaを選択します。

4. 接続したいAthenaデータベースのAWSリージョンDatabase 名前を入力します。

5. クエリ結果を保存するAmazon S3場所のパスを入力してください。パスの先頭にはS3を付けてください。

6. Database 名前Connection 名前ユーザー名パスワードを入力して、データベース接続を認証します。

Notes
メモ: Connection 名前は各接続ごとに一意である必要があります。



7. 接続ボタンをクリックします。

Notes
メモ: 今後データをインポートするために接続設定が保存されます。認証情報は安全に暗号化されて保存されます。

8. インポートが必要なテーブルを選択します。



9. SQLクエリを使用して、データを選択およびインポートすることも可能です。

Warningクエリを使用してデータベースからインポートする場合、増分フェッチオプションは利用できません。こちらをクリックして、クラウドデータベースからの増分フェッチの詳細をご確認ください。



10. インポートするをクリックして、Athenaアカウントからのデータインポートを開始します。

11. データのインポートが完了すると、 Pipeline builder ページが開き、トランスフォームの適用を開始できます。ステージを右クリックし、 Prepare data オプションを選択することで、 DataPrep Studio ページでさまざまなトランスフォームを使ってデータを準備できます。 こちらをクリック すると、トランスフォームの詳細をご覧いただけます。



12. データフローの作成および各ステージで必要な変換の適用が完了したら、ステージを右クリックして宛先を追加してデータフローを完了できます。
Notes
メモ: パイプラインへの宛先追加後、まず手動実行でパイプラインを実行し、正常に動作することを確認してください。手動実行で問題がなければ、スケジュールを設定してパイプラインを自動化できます。各種実行タイプの詳細はこちらをご覧ください。
スケジュール、バックフィル、手動更新、Webhook、またはZoho Flowの設定時には、すべてのソースに対してインポート設定が必須となります。インポート設定を行わないと、実行を保存できません。インポート設定方法の詳細はこちらをクリックしてご確認ください。

13. 実行の設定後、パイプラインジョブがその実行時に作成されます。ジョブのステータスや詳細は、Job概要で確認できます。こちらをクリックすると、Job概要の詳細をご覧いただけます。

Info
情報: Amazon Athena へのデータエクスポートはサポートしていません。

Amazon Athena 接続の編集方法

DataPrep では、データの外部連携情報を保存しておくことで、毎回認証情報を入力する手間を省けます。保存済みのデータ連携は、編集 connection オプションからいつでも編集・更新し、新しいパラメーターや認証情報を追加できます。

1. 新しいデータセットを作成する際、データ元を選択ボックスから保存済み外部連携をクリックします。



2. データインポート画面から保存済み外部連携を管理できます。省略記号アイコンをクリックすると、連携の共有・編集・概要の表示・削除が行えます。



3. 編集 connection オプションをクリックして、新しいパラメーターや認証情報で保存済み連携を更新します。

関連項目