URLからデータをインポートする

URLからデータをインポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




CSV、TSV、JSON、HTML、XLS、XLSX、XMLファイルのURLを入力できます。DataPrepは、認証が必要なURLインポートにも対応しています。

URLからファイルをインポートする方法

1. ワークスペースを作成するか、既存のワークスペースを開きます。こちらをクリックしてワークスペースの作成方法をご覧ください。

2. URLをクリックし、データ元の選択セクションから選択します。



2. データセット名と取得するデータのリクエストURLを入力します。

Info
サンプルを試すリンクをクリックすると、サンプルデータセットをインポートして動作を確認できます。

3. 必要なパラメーターやヘッダーを入力します。
Notes
例:パラメーターやヘッダーにデータ型、コンテンツ形式、使用する言語などを指定できます。


4. データをページごとにインポートしたい場合は、ページネーション設定のいずれかを選択します。       

Notes
メモ:なしオプションは初期設定で選択されています。

ページネーション

i) ページ番号 - データが複数ページに保存されており、その順番でインポートしたい場合にこのオプションを選択します。このオプションを利用する際は、以下の情報を指定してください:
  1. ページ番号パラメーター:APIやURLプロバイダーが指定するページパラメーター名です。
  1. 初期値:インポートを開始したい最初のページ番号です。
  1. リクエスト数:連続して実行するリクエストの回数です。
      

上記のスクリーンショットでは、10ページ分のデータを取得しています。URLは次のように10回実行されます。

          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=1
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=2
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=3
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=4
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=5
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=6
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=7
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=8
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=9
          http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?Page=10

ここで、パラメーター名はPage、リクエストの回数は10回です。

ii) Offsetとlimit - 大規模なデータセットがあり、開始位置と各バッチのサイズを指定してデータをバッチ単位でインポートしたい場合は、このオプションを選択してください。このオプションを利用する際は、以下の詳細を入力する必要があります。

  1. Offsetパラメーター:APIプロバイダーが提供するoffsetパラメーター名です。
  1. 初期値:offsetの初期値を入力してください。
  1. リクエスト回数:連続して実行するリクエストの回数です。
  1. Limitパラメーター:APIプロバイダーが提供するlimitパラメーター名です。
  1. Limit値:offsetから取得するデータの件数です。


URLhttp://dataprepubuntu2。csez。zylker。com/Pagination_Data/JSONData(OffsetとLimitパラメーター対応、1回のAPI通話につき100件のデータ取得可)から1000件のデータを取得するには、以下のように10回呼び出す必要があります。

http://dataprep-ubuntu2。csez。zylker。com/Pagination_Data/JSONData?limit=100&offset=+10、-10

2番目のリクエストでは、Offsetパラメーターの値は前のoffset値+limitとなります。

ここでOffsetパラメーター名はOffsetLimitパラメーター名はLimitです。Limit値は100、リクエスト数は10です。

iii)次ページURL - データが複数ページに分かれており、各ページが次のページのURLを持っている場合はこのオプションを選択してください。このオプションを利用する場合は、以下の詳細を入力する必要があります。

  URLプロパティパス:次ページのURLを取得できるプロパティ名を指定します。



上記のスクリーンショットでは、次ページURLプロパティは/next_page_URLです。次ページはJSONプロパティ/next_page_URLから取得されます。この処理は/next_page_URLプロパティが空またはnullになるまで継続されます。

Notes
メモ:
1. 次ページURLのページネーションはJSONおよびXMLファイルにのみ適用されます。
2. これらのページネーション設定は、APIプロバイダーが許可している場合にのみZoho DataPrepで利用可能です。

5. 認証タイプのいずれかを選択し、この接続に名前を付けてください。
  • いいえ Auth - 提供されたURLは認証を必要としません。
  • 基本 Auth - URLには「ユーザー名」と「パスワード」を使用してURLを認証し、データをインポートする必要があります。
  • OAuth2。+10、-10 - URLはOAuth2。+10、-10認証技術で保護されています。「クライアントID」、「Client シークレット」、「Access Token」、「更新する token」を使用してURLを認証し、インポートを許可します。
Notes
メモ: Authの設定は今後URLからインポートする際のために保存されます。認証情報は安全に暗号化されて保存されます。



6. Connection 名前 テキストボックスに接続の名前を入力します。



7. Authenticate をクリックしてURLからデータを取得します。

8. データのインポートが完了すると、データセットが開き、すぐにデータの準備を開始できます。

Notes
メモ: Schedule インポートするオプションを利用して、ワークスペース内のデータセット、またはDataPrep Studioページ上部のインポートするメニューからインポートのスケジュール設定が可能です。こちらをクリックして詳細をご確認ください。

URL接続を編集するには

DataPrepはデータ外部連携情報を保存し、毎回認証情報を入力する手間を省きます。保存されたデータ接続は、編集 connection オプションでいつでも編集・新しいパラメーターや認証情報に更新できます。

1. 新しいデータセットを作成する際、選択する a data データ元ボックスからSaved data 外部連携をクリックします。



2. データインポート画面から保存済みのデータ外部連携を管理できます。3点リーダー(…)アイコンをクリックすると、共有、編集、接続概要の表示、または削除が行えます。



3. 編集 connectionオプションをクリックして、保存済み接続を新しいパラメーターや認証情報で更新します。

4. データをページごとにインポートしたい場合は、Paginationタブでページネーション設定も編集できます:
  1. ページ番号
  2. オフセットとリミット
  3. 次ページURL
こちらをクリックして、ページネーションについて詳しくご覧ください。



5. 更新するボタンをクリックして接続を更新します。

よくある質問(FAQ)

1. Microsoft Dynamics 365 に OData フィード URL を使って接続する際、「AADSTS54005: OAuth2 Authorization コードはすでに利用済み」というエラーが表示されるのはなぜですか?


このエラーは、Microsoft Dynamics 365 に接続する際に offline_access スコープが次の値と等しくない場合に発生します。
このスコープがない場合、Microsoft はレスポンスで access_token のみを返し、refresh_token は作成されません。Zoho DataPrep では現在のトークンが期限切れとなった際に新しい access token を生成するために refresh_token が必要なため、上記のエラーで接続が失敗します。そのため、Zoho DataPrep のようなサービスでは、'offline_access' スコープを追加することが必須となり、円滑な認証とトークンの更新が可能となります。

この問題を回避するには、認可時にoffline_accessスコープを他のスコープと一緒に追加してください。このスコープにより、Zoho DataPrep は自動的に更新トークンを利用して接続を維持でき、毎回新しい認可コードを取得する必要がなくなります。offline_access スコープの詳細については、こちらをクリックしてください。



関連情報  
新しいデータセットを追加する方法
FTP サーバーからデータをインポートする方法
ローカルファイルからデータをインポートする方法
インポートのスケジュール設定方法