URLからデータをインポートする

URLからデータをインポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




CSV、TSV、JSON、HTML、XLS、XLSX、XMLファイルのURLを入力できます。DataPrepは認証が必要なURLインポートにも対応しています。

URLからファイルをインポートする方法

1. ワークスペースを作成するか、既存のワークスペースを開きます。こちらをクリックすると、ワークスペースの作成方法をご覧いただけます。

2. URLをクリックし、 データ元を選択 のセクションから選びます。



2. データセット名とデータ取得用のリクエストURLを入力します。

Info
サンプルを試すリンクをクリックすると、サンプルデータセットをインポートして動作を確認できます。

3. 必要なパラメーターとヘッダーを入力します。
Notes
例として、データ型やコンテンツ形式、使用言語などをパラメーターやヘッダーで指定できます。
      


4. ページごとにデータをインポートしたい場合は、いずれかのページネーション設定を選択します。       

Notes
メモ: なしオプションが初期設定として選択されています。

ページネーション

i) ページ番号 - データが複数ページに保存されており、同じ順番でインポートしたい場合にこのオプションを選択してください。利用時には以下の詳細を入力する必要があります:
  1. ページ番号パラメーター: これは、APIやURLプロバイダーによって提供されるページパラメーター名です。
  1. Initial 値 : 取り込みを開始したい最初のページ番号を指定します。
  1. 番号 of requests : 順番に実行するリクエストの件数を指定します。
      

上記のスクリーンショットでは、10ページ分を取得しています。URLは下記のように10回実行されます:

          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=1
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=2
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=3
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=4
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=5
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=6
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=7
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=8
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=9
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=10

この例では、パラメーター名は「Page」、リクエストの件数は10です。

ii) Offset and limit - データセットが大きい場合や、開始位置と各バッチのサイズを指定してデータをバッチ単位でインポートしたい場合にこのオプションを選択します。このオプションを利用する際は、以下の詳細を入力してください:

  1. Offset parameter : ご利用中のAPIプロバイダーから提供されるオフセットパラメーター名を指定します。
  1. Initial 値 : オフセットの初期値を入力します。
  1. 番号 of requests : 順番に実行するリクエストの件数を指定します。
  1. Limit parameter : ご利用中のAPIプロバイダーから提供されるリミットパラメーター名を指定します。
  1. Limit 値 : オフセットから取得するデータの件数を入力します。


1000件のデータ差出人を取得するには、OffsetおよびLimitパラメーター(API通話ごとに100件のデータ)をサポートするURL http://dataprepubuntu2。csez。zylker。com/Pagination_Data/JSONData を以下のように10回呼び出す必要があります。

http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?limit=100&offset=+10、-10

2回目のリクエストからは、Offsetパラメーターの値は直前のoffset値にlimitを加えたものになります。

ここでOffsetパラメーター名はOffsetLimitパラメーター名はLimitです。Limitの値は100、リクエスト回数は10回となります。

iii) 次ページURL - データがページごとに分かれていて、それぞれのページに次ページのURLが含まれている場合、このオプションを選択してください。このオプションを使用する場合、以下の情報を入力する必要があります。

    URLプロパティパス:次ページのURLを取得できるプロパティ名を指定します。



上記のスクリーンショットでは、次ページURLプロパティは /next_page_URL です。次ページはJSONプロパティ /next_page_URL から取得されます。この処理は、/next_page_URL プロパティが空またはnullになるまで繰り返されます。

Notes
メモ:
1. 次ページURLによるページネーションは、JSONおよびXMLファイルにのみ適用されます。
2. これらのページネーション設定は、APIプロバイダーが許可している場合のみZoho DataPrepで利用できます。

5. 認証タイプを1つ選び、この接続に名前を付けてください。
  • いいえ Auth - 提供されたURLは認証を必要としません。
  • 基本 Auth - URLにアクセスしてデータをインポートするには、「ユーザー名」と「パスワード」で認証が必要です。
  • OAuth2。+10、-10 - URLはOAuth2。+10、-10認証方式で保護されています。「クライアントID」、「Client シークレット」、「Access Token」、「更新するtoken」で認証し、インポートを許可します。
Notes
メモ: Authの設定は今後URLからインポートする際のために保存されます。認証情報は安全に暗号化されて保存されます。



6. Connection 名前テキスト箱に接続の名前を入力します。



7. AuthenticateをクリックしてURLからデータを取得します。

8. データのインポートが完了すると、データセットが開かれ、すぐにデータの準備を開始できます。

Notes
メモ: Schedule インポートするオプションを利用して、ワークスペース内のデータセットや、DataPrep Studioページ上部のインポートするメニューからインポートのスケジュール設定が可能です。こちらをクリックして詳細をご覧ください。

URL接続を編集するには

DataPrepは、データソースや宛先への接続時に毎回認証情報を入力する手間を省くため、データ外部連携を保存します。保存済みのデータ接続は編集 connectionオプションでいつでも編集・更新でき、新しいパラメーターや認証情報を追加できます。

1. 新しいデータセット作成時に選択する a data データ元箱からSaved data 外部連携をクリックします。



2. データインポート画面から保存済みデータ外部連携の管理が可能です。3点リーダー(…)アイコンをクリックすると、共有、編集、接続概要の表示、または接続の削除が行えます。



3. 編集 connectionオプションをクリックし、保存済み接続に新しいパラメーターや認証情報を追加・更新します。

4. Paginationタブでページごとにデータをインポートしたい場合、ページネーションの設定も編集できます。
  1. ページ番号
  2. オフセットとリミット
  3. 次のページURL
こちらをクリックしてページネーションの詳細をご覧ください。



5. 更新するボタンをクリックして接続を更新します。

関連情報  
新規データセットを追加する方法
FTPサーバーからデータをインポートする方法
ローカルファイルからデータをインポートする方法
インポートのスケジュール設定方法