お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
CSV、TSV、JSON、HTML、XLS、XLSX、またはXMLファイルのURLを入力できます。DataPrepでは、認証が必要なURLインポートにも対応しています。このコネクターを利用することで、ETLワークフローを効率化し、スムーズなデータ移動やURLとZoho DataPrep間のデータ統合を簡単に実現できます。
URLからファイルをインポートする方法
1. パイプラインを作成 または ホーム ページ、 Pipelines タブや Workspaces タブから既存のパイプラインを開き、 データを追加 オプションをクリックします。また、 データをインポート オプションを Workspaces タブ内でクリックし、データをインポートできます。
情報: パイプラインビルダーの上部にある
データをインポート 
アイコンをクリックすることで、複数のソースからパイプラインへデータを取り込むことも可能です。
2. URLを データ元を選択セクションからクリックします。
3. データセット名とデータ取得用のリクエストURLを入力します。
サンプルを試すリンクをクリックして、サンプルデータセットをインポートし、動作を確認することもできます。
4. 必要なパラメーターとヘッダーを入力します。
例として、パラメーターやヘッダーにデータ型、content形式、使用している言語を指定できます。
5. データをページ単位でインポートしたい場合は、いずれかのページネーション設定を選択してください。
メモ: なしオプションがデフォルトで選択されています。
ページネーション
i) ページ番号 - データが複数ページに保存されており、同じ順序でインポートしたい場合はこのオプションを選択してください。このオプションを利用する際は、次の詳細を入力する必要があります。
- ページ番号パラメーター: APIやURLプロバイダーが提供するページパラメーター名です。
- 初期値: インポートを開始したい最初のページ番号です。
- リクエスト数: 連続して実行するリクエストの数です。
上記のスクリーンショットでは、10ページ分を取得しています。URLは次のように10回実行されます。
ここで、パラメーター名はPage、リクエストの番号は10です。
ii) Offsetとlimit - 大規模なデータセットがあり、開始位置と各バッチのバッチサイズを指定してバッチごとにデータをインポートしたい場合は、このオプションを選択してください。このオプションを利用する際は、以下の詳細を入力する必要があります。
- Offsetパラメーター:APIプロバイダーから提供されたoffsetパラメーター名です。
- 初期値:offsetの初期値を指定します。
- リクエスト数:連続して実行するリクエストの数です。
- Limitパラメーター:APIプロバイダーから提供されたlimitパラメーター名です。
- Limit値:offsetから取得するデータの件数です。
2 回目以降のリクエストでは、Offset パラメーター値は直前の offset 値に limit を加えた値になります。
ここで Offset パラメーター の名前は Offset、Limit パラメーター の名前は Limit です。Limit 値は 100、リクエストの回数は 10 回です。
iii) 次ページ URL - データがページごとに分かれており、各ページが次ページのURLを持つ場合はこのオプションを選択してください。このオプションを利用する際は、以下の詳細を入力してください。
URL プロパティパス:次ページのURLを取得できるプロパティ名を指定します。
上記のスクリーンショットでは、次ページのURLプロパティは /next_page_URL です。次ページは JSON プロパティ /next_page_URL から取得されます。/next_page_URL プロパティが空または null になるまで処理が続行されます。
メモ:
1. 次ページ URL ページネーションは、JSON および XML ファイルにのみ適用されます。
2. このページネーション設定は、API プロバイダーが許可している場合のみ Zoho DataPrep で利用できます。
6. 認証タイプを選択し、この接続に名前を付けてください。
- いいえ Auth - 入力した URL には認証が必要ありません。
- 基本 Auth - 入力した URL には「ユーザー名」と「パスワード」を使用して認証し、データをインポートします。
- OAuth2.0 - このURLはOAuth2.0認証方式で保護されています。認証およびインポートを行うためには、「クライアントID」、「Client シークレット」、「Access Token」、および「更新する token」が必要です。
メモ: 今後URLからインポートする際の認証設定は保存されます。認証情報は安全に暗号化され、保管されます。
7. Connection 名前 テキスト箱に、接続の名前を入力します。
8. Authenticateをクリックして、URLからデータを取得します。
9. データのインポートが完了すると、 Pipeline builder ページが開き、ETLパイプラインへのトランスフォームの適用を開始できます。ステージを右クリックし、 Prepare data オプションを選択することで、 DataPrep Studio ページでさまざまなトランスフォームを使ってデータを準備できます。 こちらをクリック してトランスフォームの詳細をご覧ください。
10
. データフローの作成と、各ステージで必要なトランスフォームの適用が完了したら、ステージを右クリックして宛先を追加してデータフローを完了します。
メモ: ETLパイプラインに宛先を追加した後、最初に手動実行でパイプラインをテストすることを推奨します。手動実行が問題なく動作することを確認したら、スケジュールを設定してパイプラインおよびデータ転送を自動化できます。さまざまな実行タイプについてはこちらをご参照ください。
スケジュール、バックフィル、手動更新、Webhook、またはZoho Flowの設定時には、インポート設定をすべてのデータ元に対して必ず行う必要があります。インポート設定を行わないと、実行を保存できません。インポート設定の方法については、
こちらをクリックしてご確認ください。
11. 実行の設定後、指定した時刻にパイプラインジョブが作成されます。ジョブのステータスや詳細は、ジョブ概要で確認できます。
こちらをクリックしてジョブ概要の詳細をご覧ください。
URL接続を編集するには
DataPrepは、データの外部連携情報を保存し、接続するたびに認証情報を繰り返し入力する手間を省きます。保存済みのデータ接続は、接続の編集オプションを使って、いつでも新しいパラメーターや認証情報で更新できます。
1. 新規データセット作成時、選択する a data データ元ボックスからSaved data 外部連携をクリックします。
2. データインポート画面から直接、保存済みのデータ外部連携を管理できます。省略記号(3点リーダー)アイコンをクリックして、連携の共有、編集、概要表示、または削除を行います。
3. 編集 connection オプションをクリックして、保存済みの連携に新しいパラメーターや認証情報を追加して更新します。
4. データをページごとにインポートしたい場合は、Paginationタブでページネーション設定も編集できます。
- ページ番号
- オフセットと上限
- 次ページのURL
5. 更新するボタンをクリックして、連携内容を更新します。
関連情報