OneDriveからのデータインポート

OneDriveからのデータインポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




Zoho DataPrep では、Microsoft が提供するファイルホスティングサービスである OneDrive からデータをインポートできます。OneDrive を使用すると、ユーザーはファイルを保存、保護、共有、同期できます。

OneDrive からデータをインポートするには

1. 既存のパイプラインを開くか、パイプラインを作成しますホームページ、Pipelines タブ、または Workspaces タブから操作し、データを追加オプションをクリックします。
Info情報: パイプラインビルダー上部の データをインポートアイコンをクリックして、複数のソースからパイプラインにデータを取り込むこともできます。



2. 左側ペインでクラウドストレージカテゴリを選択し、OneDriveアイコンをクリックして、OneDrive からインポートします。必要なクラウドストレージサービスは検索ボックスから検索することもできます。
 


Notes 以前に OneDrive の接続を追加している場合は、 保存済みデータ接続 オプションをクリックしてインポートを続行できます。保存済みデータ接続の詳細については、 こちら を参照してください。



3. すでに接続を追加している場合は、その既存の接続をクリックして、データのインポートを開始します。



Notes [ 新規追加 ] リンクをクリックして、新しい OneDrive アカウントを追加することもできます。必要に応じて複数の OneDrive 接続を作成できます。

4. OneDrive アカウントを認証します。初めて実行する場合は、ファイルへアクセスできるよう DataPrep を認証する必要があります。


Notes
メモ: OneDrive と SharePoint に同じ Microsoft アカウントで認証している場合、SharePoint からログアウトすると、同じ Microsoft アカウントに紐づくサービスであるため OneDrive からもログアウトされます。必ず該当する Microsoft アカウントにログインしていることを確認してください。




Notes
この接続設定は、今後 OneDrive からインポートする際に使用できるよう保存されます。認証情報は安全に暗号化されて保存されます。

 

5. インポートしたいファイルを選択し、 インポート ボタンをクリックします。[ 自分に共有 ] タブから共有されているファイルを選択することもできます。詳細選択オプションを使用して、特定のパターンに一致するファイルをインポートすることも可能です。こちらをクリックして詳細をご確認ください。




6. HTML、XLS、または XLSX ファイルの場合は、プレビューオプションをクリックして、データのサンプルを表示できます。


7. ファイルがパスワード保護されている場合は、パスワードを入力し、 右矢印をクリックしてから、インポートをクリックします。

Notesメモ : 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルをインポートすることもできます。メモ : ZIP ファイルの場合、サポートされるのは 1 つのファイルのみです。ZIP 内には 1 つのファイルのみが圧縮されていることを確認してください。


 

54:: 755:: データのインポートが完了すると、 56:: Pipeline builder 57:: ページが開き、変換の適用を開始できます。ステージを右クリックして、58:: Prepare data59:: オプションを選択し、 60:: DataPrep Studio ページでデータを準備することもできます。 61:: こちらをクリック 62:: して、利用できる変換について詳しく確認してください。




63:: 8. データフローの作成と、各ステージで必要な変換の適用が完了したら、ステージを右クリックして64:: 出力先を追加65:: し、データフローを完了します。

Notes66:: メモ: パイプラインに出力先を追加した後は、67:: まず手動実行でパイプラインを実行してみることをお勧めします。手動実行で問題なく動作することを確認したら、68:: スケジュール69:: を設定して、パイプラインを自動実行できます。さまざまな実行タイプについては 70:: こちら71:: を参照してください。

72:: 詳細選択

73:: 詳細選択を使用してファイルをインポートするには、

74:: 1. 75:: 詳細選択76:: リンクをクリックします。



77:: 詳細選択では、正規表現(regex)に基づいて動的にファイルを選択できます。これは、One78:: Drive 79:: アカウント80:: から新規データや増分データを取得する場合に利用できます。前回の同期以降に追加または更新され、ファイルパターンに一致したファイルが、One81:: Drive 82:: アカウント83:: から取得されます。84:: クラウドストレージからの85:: 増分フェッチ86:: について詳しくは、こちらをクリックしてください。


Info
87:: 重要: 詳細選択は増分フェッチ専用ではありません。ファイルパターンに基づいて複数ファイルを一括インポートする場合にも、このオプションを使用できます。
Notes88:: メモ : 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルをインポートすることもできます。メモ : ZIP ファイルの場合、サポートされるのは 1 つのファイルのみです。.zip ファイル内には 1 つのファイルのみが圧縮されていることを確認してください。


89:: 2. 次の詳細を入力します。

  • 90:: フォルダーの選択 91:: : データをインポートするフォルダーを選択します。

  • 92:: フォルダーパス 93:: : ファイルを検索するフォルダーのパスを指定します(例: Incremental_fetch/)。
    94:: ファイルがドライブ直下(フォルダーなし)に保存されている場合は、この項目は空のままにできます。
    Alert
    95:: 「フォルダーパス」はディレクトリパス項目であり、正規表現パターンはサポートされません。
    Info96:: Info:97:: フォルダーパスは大文字と小文字が区別されます。

  • 98:: サブフォルダーを含める 99:: : ファイル検索時にサブフォルダーも対象に含める場合は、100:: サブフォルダーを含める 101:: チェックボックスを選択します。

  • 102:: ファイルパターン 103:: : 104:: アカウント105:: 内のファイル名と照合するために使用するパターンです。正規表現によるマッチングをサポートします。指定したパス内の任意のファイルに一致させるには、' .* ' パターンを使用できます。

    Info106:: Info:107:: ファイルパターンは大文字と小文字が区別されます。



Notes

108:: メモ:109:: ファイルパターンの照合には、シンプルな正規表現マッチングが使用されます。例えば、110:: 111:: Sales_2022.csv、Sales_2023.csv、Sales_2024.csv112:: のようなファイルを取得するには、パターン 113:: Sales_.* を入力します。


114:: 同様に、115:: PublicData1.csv、PublicData2.csv、PublicData3.csv116:: のようなファイルを取得するには、117:: PublicData.*


118:: 単一のファイルのみをインポートしたい場合は、119:: 正確なファイル名を使用してパターンを指定してください120:: 。
121:: 例:122:: leads_jan_2022.*


  • 123:: ファイルパスワード: 124:: ファイルがパスワード保護されている場合は、パスワードを入力します。

  • 125:: ファイルをマージしてインポート126:: - 指定したパターンに一致するすべてのファイルをマージし、1 つのデータセットとしてインポートします。
    Idea
    127:: このオプションを使用すると、インポート時にファイルをまとめてマージでき、インポート後に結合処理を行う必要がありません。
    Info128:: 情報:129:: このオプションで一度にマージできるファイルは最大 5 件までです。
    Notes130:: メモ: 131:: このチェックボックスをオフにすると、一度に取得されるファイルは 1 件のみになります。

    132:: 例: OneDrive アカウントに 10 個のファイルがある場合、最初の 5 個が 1 つのデータセットにマージされてインポートされます。次回の更新時に、残りの 5 個がマージされてインポートされます。

    133:: 同様に、OneDrive アカウントに 8 個のファイルがある場合、最初の 5 個がマージされて先に取得され、その後に残りの 3 個が取得されます。
  • 134:: ファイルの種類: 135:: 必要なファイル形式を選択します。利用可能な形式は、CSV、TSV、JSON、XLS、XLSX、XML、TXT です。
  • 136:: シートパターン: このオプションは XLS および XLSX 形式でのみ利用できます。 137:: ファイル内のシート名と照合するためのパターンを指定します。正規表現によるパターンマッチングをサポートします。ファイル内の任意のシートに一致させるには、パターン「.*」を使用できます。

    Notes
    138:: シートパターンの照合もシンプルな正規表現ベースのマッチングです。たとえば、Sales_2022、Sales_2023、Sales_2024 という名前のシートを取得するには、パターン「Sales_.*」を入力します。

    139:: 同様に、PublicData1、PublicData2、PublicData3 などのシートを取得するには、「PublicData.*」を使用します。

    140:: 単一のシートのみをインポートしたい場合は、そのシート名と完全に一致するパターンを指定してください。
    141:: 例: Leads_Jan_2022.*
  • 142:: シートパスワード: このオプションは XLS および XLSX 形式でのみ利用できます。シートがパスワード保護されている場合は、パスワードを入力します。
  • 143:: シートをマージしてインポート: 指定したパターンに一致するすべてのシートをマージし、1 つのデータセットとしてインポートします。

Idea
144:: このオプションを使用すると、インポート時にシートをまとめてマージでき、インポート後に結合処理を行う必要がありません。
145:: 3.  146:: インポート 147:: ボタンをクリックします。



Notes
148:: メモ: 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルもインポートできます。

149:: ZIP ファイルの場合、サポートされるのは 1 ファイルのみです。.zip ファイル内に圧縮またはアーカイブされているファイルが 1 つだけであることを確認してください。
 

150:: ファイル解析

151:: ファイル解析152:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。

153:: 154:: ファイル解析155:: には、156:: 自動解析157:: と 158:: カスタム解析159:: の 2 つの設定があります。

  1. 160:: 自動解析161:: - 区切り文字、ヘッダー、エンコーディングなどのファイル構造を自動的に検出し、それに応じてデータを整形します。
  2. 162:: カスタム解析163:: - ファイルの読み取り方法を手動で設定でき、区切り文字、ヘッダー、エンコーディングなどの設定を細かく制御できます。

164:: カスタム解析165:: では、次の設定を利用できます。

  • 166:: ファイルエンコーディング:167:: ファイルエンコーディングオプションから UTF-8 などの168:: 文字エンコーディング方式169:: を選択して、ファイルをエンコードできます。

  • 170:: テキスト修飾子:171:: 文字列項目の開始と終了を示す文字(シングルクォート (') やダブルクォート (') など)を指定できます。

  • 172:: 区切り文字:173:: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字でデータを分割できます。独自の区切り文字を定義できる174:: カスタム区切り文字175:: オプションもあります。

  • 176:: 先頭行をスキップ:177:: ファイルの先頭から指定した行数の解析をスキップします。

  • 178:: コメント文字:179:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。

  • 180:: エスケープ文字:181:: 区切り文字や引用符を通常の文字として扱うために使用するエスケープ文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) などがあります。

  • 182:: スペースを自動的にトリム:183:: データインポート時に、すべての列の先頭および末尾の空白文字を削除します。

  • 184:: データにヘッダー行を含める:185:: 列ヘッダーとして使用する行番号を指定します。

186:: ファイル解析設定

187:: 以下の表では、クラウドストレージサービス向けのファイルインポート設定について説明します。




188:: 関連情報

189:: 新しいパイプラインを追加する190:: 方法

191:: クラウドデータベースからデータをインポートする方法

192:: 保存済みデータ接続からデータをインポートする方法

193:: パイプラインをスケジュールする方法        

194:: Zoho DataPrep で利用できるその他のクラウドストレージ設定 

195:: データを OneDrive にエクスポートする方法