Boxからのデータインポート

Boxからのデータインポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

  

 

0:: Zoho DataPrep は、クラウドストレージサービスである Box からのデータインポートに対応しています。1:: Box を使用すると、ユーザーはファイルを保存し、共同作業を行い、 2:: セキュアに管理できます。3:: また、あらゆるデバイスからアクセス可能なオンラインフォルダーシステムとして利用できます。

Alert
4:: メモ: Box クラウドストレージのサポートは US データセンターでのみ利用できます。

5:: Box からデータをインポートする方法

6:: 1. 既存のパイプラインを開くか、7:: パイプラインを8:: 作成9:: し、10:: ホーム11:: ページ、12:: パイプライン13:: タブ、または 14:: ワークスペース15:: タブから、16:: データを追加17:: オプションをクリックします。
Info18:: 情報: パイプラインビルダー上部の19:: データをインポート20:: アイコンをクリックして、複数のソースからパイプラインにデータを取り込むこともできます。



21:: 2.22:: 左側のペインで 23:: クラウドストレージ24:: カテゴリーを選択し、25:: 26:: Box27:: アイコンをクリックして、Box からインポートします。28:: 必要なクラウドストレージサービスは、検索ボックスから検索することもできます。
 


Notes29:: メモ: すでに Box 接続を追加済みの場合は、左側のペインで 30:: 31:: 32:: 保存済み接続33:: 34:: カテゴリーをクリックしてインポートを続行してください。保存済み接続の詳細については 35:: 、36:: こちら37:: を参照してください。


38:: 3. 39:: すでに接続を追加している場合は、既存の接続をクリックして、データのインポートを開始します。40::



Notes41:: メモ: 42:: 新しい Box アカウントを追加するには、43:: 新規追加44:: リンクをクリックします。必要に応じて、複数の Box 接続を作成できます。

 

45:: 4. Box アカウントを認証します。初めて認証する際は、DataPrep にファイルへのアクセスを許可する必要があります。



Notes
46:: メモ: 接続設定は、今後 Box からインポートする際に使用できるよう保存されます。認証情報は安全に暗号化され、保存されます。

 

47:: 5. 48:: インポートするファイルを選択し、
49:: インポート
50:: ボタンをクリックします51:: 。特定のパターンに一致するファイルのみをインポートする場合は、[詳細選択]オプションを使用できます。52:: こちらをクリック53:: して詳細をご確認ください。
Info
54:: 情報: Box で新規作成されたファイルが検索結果に反映されるまでには、最大 10 分かかる場合があります。

 



Notes55:: メモ: Box の共有フォルダーからファイルをインポートすることもできます。56:: 57::  58:: 共有されたファイルは、59:: My drive60:: タブにも表示されます61:: 。

62:: 6. 63:: HTML、XLS、または XLSX ファイルの場合は、64:: Preview65:: オプションをクリックして、データのサンプルを表示できます。

 

66:: 7. 67:: ファイルがパスワードで保護されている場合は、パスワードを入力し、68:: 右矢印をクリックします。



69:: 8. 70:: 71:: インポート72:: をクリックします。



 

73:: 9. データのインポートが完了すると、74:: 75:: Pipeline builder 76:: ページが開き、変換を適用し始めることができます。ステージを右クリックして、77:: Prepare data78:: オプションを選択し、 79:: DataPrep Studio ページでデータを準備することもできます。80:: こちらをクリック 81:: して、変換の詳細をご確認ください。




82:: 10. データフローの作成と、各ステージで必要な変換の適用が完了したら、ステージを右クリックして83:: 出力先を追加84:: し、データフローを完了できます。

Notes85:: メモ: パイプラインに出力先を追加したら、まず手動実行でパイプラインを実行してみてください。86:: 手動実行が問題なく動作することを確認したら、87:: スケジュール88:: を設定してパイプラインを自動化できます。さまざまな実行タイプについては 89:: こちら90:: をご覧ください。


91:: 詳細選択

92:: 詳細選択を使用してデータをインポートするには、

93:: 1. 94:: Advanced selection 95:: リンクをクリックします。

96:: Advanced selection を使用すると、正規表現に基づいて動的にファイルを選択できます。これにより、97:: Box 98:: アカウントから新規または増分データを取得できます。 99:: 指定したデータ間隔中にファイルパターンに一致する、新規作成または更新済みのファイルが、100:: Box アカウントから取得されます。 101:: 詳細については、102:: インクリメンタルフェッチについての説明をご覧ください。

Info
103:: 重要: Advanced selection はインクリメンタルフェッチ専用ではありません。ファイルパターンに基づいてファイルを一括インポートする場合にも使用できます。


104:: 2. 次の内容を入力します。

  • 105:: フォルダー path106:: : ファイルを検索するフォルダーのパスです。例: 2023/ 
    107:: ファイルがフォルダーを使用せずドライブ直下に保存されている場合は、この項目は空のままにできます。
    Alert
    108:: 「フォルダー path」はディレクトリパスの項目であり、正規表現パターンには対応していません。
    Info109:: 情報: 110:: フォルダー path は大文字と小文字が区別されます。
    Notes111:: メモ112:: : 113:: Box で新しく作成されたファイルが DataPrep のインポート画面に反映されるまで、 114:: 最大 115:: 10 分かかる場合があります。

  • 116:: サブフォルダーを含める117:: : ファイル検索時にサブフォルダーも対象に含めたい場合は、 118:: サブフォルダーを含める 119:: チェックボックスを選択します。

  • 120:: ファイルパターン121:: : アカウント内のファイル名にマッチさせるために使用するパターンです。正規表現形式のマッチングをサポートします。指定したパス内の任意のファイルにマッチさせるには、'.*' というパターンも使用できます。
    Info122:: 情報: 123:: ファイルパターンは大文字と小文字を区別します。
Notes
124:: メモ: ファイルパターンのマッチングはシンプルな正規表現ベースのマッチングです。たとえば、Sales_2022.csv、Sales_2023.csv、Sales_2024.csv というファイル名のファイルを取得するには、パターン 125:: Sales_.* を入力します。

126:: 同様に、PublicData1.csv、PublicData2.csv、PublicData3.csv などのファイルを取得するには、127:: Public.* を使用します。

128:: 単一のファイルのみをインポートする場合は、そのファイル名を正確に指定したパターンを入力してください。
129:: 例: leads_jan_2022.*

  • 130:: ファイルパスワード: 131:: ファイルがパスワードで保護されている場合は、そのパスワードを入力します。

  • 132:: ファイルをマージしてインポート 133:: - 指定したパターンにマッチするすべてのファイルをマージし、1 つのデータセットとしてインポートします。 
134:: 重要: このオプションを使用すると、インポート時にファイルをまとめてマージでき、インポート後に結合処理を行う必要がありません。
Info135:: 情報: 136:: このオプションで一度にマージできるファイルは最大 5 件までです。
Notes137:: メモ: 138:: このチェックボックスをオフにした場合は、1 回につき 1 件のファイルのみ取得されます。
139:: 例: Box 140:: アカウントに 10 件のファイルがある場合、最初の 5 件が 1 つのデータセットにマージされてインポートされます。次回の再読み込み時に、残りの 5 件がマージされてインポートされます。

141:: 同様に、Box アカウントに 8 件のファイルがある場合は、最初の 5 件が先にマージ・取得され、その後に残りの 3 件がマージ・取得されます。
  • 142:: ファイルタイプ143:: : 144:: 必要なファイル形式を選択します。利用可能な形式は、CSV、TSV、JSON、XLS、XLSX、XML、TXT です。
  • 145:: シートパターン146:: : このオプションは XLS および XLSX 形式でのみ利用できます。 147:: ファイル内のシート名にマッチさせるために使用するパターンです。正規表現形式のマッチングをサポートします。ファイル内の任意のシートにマッチさせるには、'.*' というパターンも使用できます。

    Notes
    148:: シートパターンのマッチングも、シンプルな正規表現ベースのマッチングです。たとえば、Sales_2022、Sales_2023、Sales_2024 という名前のシートを取得するには、パターン Sales_.* を入力します。

    149:: 同様に、PublicData1、PublicData2、PublicData3 などのシートを取得するには、Public.* を使用します。

    150:: 単一のシートのみをインポートする場合は、そのシート名を正確に指定したパターンを入力してください。
    151:: 例: Leads_Jan_2022.*

  • Info
    152:: 情報: シートパターンは大文字と小文字を区別します。

  • 153:: シートパスワード154:: : このオプションは XLS および XLSX 形式でのみ利用できます。シートがパスワードで保護されている場合は、そのパスワードを入力します。
  • 155:: シートをマージしてインポート156:: : 指定したパターンにマッチするすべてのシートをマージし、1 つのデータセットとしてインポートします。

Idea
157:: このオプションを使用すると、インポート時にシートをまとめてマージでき、インポート後に結合処理を行う必要がありません。

Notes158:: メモ: 159:: このチェックボックスをオフにした場合は、1 回につき 1 件のシートのみ取得されます。
160:: 3.  161:: インポート 162:: ボタンをクリックします。



Notes
163:: メモ: サポートされている形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。Zip 形式のファイルをインポートすることもできます。

164:: Zip ファイルの場合は、1 つのファイルのみサポートされます。.zip ファイル内には 1 つのファイルのみが圧縮されていることを確認してください。
 

165:: ファイルパース

166:: ファイルパース167:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。

168:: 169:: ファイルパース170:: には、171:: 自動パース172:: と 173:: カスタムパース174:: の 2 つのオプションがあります。

  1. 175:: 自動パース176:: - ファイル構造(区切り文字、ヘッダー、エンコーディングなど)を自動的に検出し、それに応じてデータを整形します。
  2. 177:: カスタムパース178:: - ファイルの読み取り方法を手動で設定でき、区切り文字、ヘッダー、エンコーディングなどの設定を完全に制御できます。

179:: カスタムパース180:: では、次のオプションを利用できます。

  • 181:: ファイルエンコーディング:182:: ファイルエンコーディングオプションを使用して、UTF-8 などの文字183:: エンコーディング方式184:: でファイルをエンコードできます。

  • 185:: テキスト修飾子:186:: テキスト項目の開始と終了を示す文字(シングルクォート (') やダブルクォート (') など)を指定できます。

  • 187:: 区切り文字:188:: コンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できる189:: カスタム区切り文字190:: オプションもあります。

  • 191:: 先頭行をスキップ:192:: ファイルの先頭から指定した行数のパースをスキップします。

  • 193:: コメント文字:194:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。

  • 195:: エスケープ文字:196:: 区切り文字や引用符をエスケープし、書式なしテキストとして扱うための文字を指定します。利用可能なオプションには、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。

  • 197:: スペースを自動的にトリム:198:: データインポート時に、すべての列の前後の空白文字を削除します。

  • 199:: データにヘッダー行を含む:200:: 列ヘッダーとして使用する行番号を指定します。


201:: ファイルパースオプション

202:: 以下の表では、クラウドストレージサービス向けのファイルインポートオプションについて説明します。



203:: 関連情報

204:: 新しいパイプラインを追加する方法205::

206:: クラウドデータベースからデータをインポートする方法

207:: 保存済みデータ接続からデータをインポートする方法

208:: パイプラインをスケジュールする方法        

209:: Zoho DataPrep で利用できるその他のクラウドストレージオプション 

210:: データを Box にエクスポートする方法211::