SharePointからのデータインポート

SharePointからのデータインポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。



  Zoho DataPrep では、SharePoint からのデータインポートに対応しています。SharePoint は、ユーザーが任意のデバイスから情報を保存、整理、共有、アクセスできるクラウドストレージサービスです。


 SharePoint からデータをインポートするには

1.既存のパイプラインを開くか、cパイプラインを作成し、ホームページ、Pipelinesタブ、またはWorkspacesタブから操作します。その後、データを追加オプションをクリックします。

InfoInfo: パイプラインビルダー上部のデータをインポートアイコンをクリックして、複数のソースからパイプラインにデータを取り込むこともできます。



2. 左側ペインでCloud storageカテゴリを選択し、 SharePoint をクリックします。また、 検索ボックスで SharePoint を検索することもできます。

 

Notesメモ: 以前に SharePoint 連携を追加している場合は、左側ペインで保存済みデータ連携カテゴリをクリックして、インポートを続行できます。保存済みデータ連携の詳細については、こちらをクリックしてください。

 

3. すでに連携を追加している場合は、既存の連携をクリックしてデータのインポートを開始します。

 

 

Notesメモ: 新しい SharePoint アカウントを追加するには、新規を追加リンクをクリックします。必要に応じて、複数の SharePoint 連携を作成できます。

 

4. SharePoint アカウントを認証します。初めて実行する場合は、ファイルへアクセスできるよう DataPrep を認証する必要があります。


Notes
メモ: OneDrive と SharePoint で同じ Microsoft アカウントを認証している場合、OneDrive からログアウトすると、同じ Microsoft アカウントにリンクされているため SharePoint からもログアウトされます。必ず該当する Microsoft アカウントにログインしていることを確認してください。



 

Notes
メモ: 接続設定は、今後 SharePoint からインポートする際に利用できるよう保存されます。認証情報は安全に暗号化されて保存されます。

 

5. 必要なサイトとドライブを選択します。インポートしたいファイルを選択し、[インポート]ボタンをクリックします。また、詳細選択オプションを使用して、特定のパターンに一致するファイルをインポートすることもできます。詳しくはここをクリックしてください。


 

6. ファイルが HTML、XLS、または XLSX の場合は、プレビューオプションをクリックして、データのサンプルを表示できます。

7. ファイルがパスワードで保護されている場合は、パスワードを入力し、 右矢印をクリックします。


8. インポートをクリックします。
Notes
メモ : 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルもインポートできます。メモ : ZIP ファイルの場合、サポートされるのは 1 つのファイルのみです。.zip ファイル内に 1 つのファイルだけが圧縮されていることを確認してください。


 

9. データのインポートが完了すると、 Pipeline builder ページが開き、変換の適用を開始できます。ステージを右クリックして、Prepare dataオプションを選択し、 DataPrep Studio ページでデータを準備することもできます。変換の詳細についてはこちらをクリック してください。




10. データフローの作成と、各ステージで必要な変換の適用が完了したら、ステージを右クリックして出力先を追加し、データフローを完了します。
Notesメモ: パイプラインに出力先を追加した後は、まず手動実行でパイプラインを実行してみてください。手動実行で問題なく動作することを確認したら、パイプラインを自動化するためにスケジュールを設定できます。さまざまな実行タイプについてはこちらを参照してください。

詳細選択

詳細選択を使用してデータをインポートするには、

1. 詳細選択リンクをクリックします。


詳細選択では、正規表現に基づいて動的にファイルを選択できます。これは、SharePoint サイトから新規データや増分データを取得する場合に使用できます。指定したデータ期間中に、ファイルパターンに一致する新規または更新済みファイルが SharePoint サイトから取得されます。増分フェッチの詳細については、こちらをクリックしてください。


Info
Important: 詳細選択は増分フェッチ専用ではありません。ファイルパターンに基づいて複数ファイルを一括インポートする場合にも、このオプションを使用できます。

Notes
メモ : 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルもインポートできます。

2. 次の詳細を入力します。

  • サイトの選択 : データをインポートするサイトを選択します。

  • ドライブの選択: データをインポートするサイト内のドライブを選択します。

  • フォルダパス : ファイルを検索するフォルダパスです。例: 2023/

    ファイルがフォルダを使用せずサイト直下に保存されている場合は、この項目は空のままにできます。

    Alert
    「フォルダパス」はディレクトリパス項目であり、正規表現パターンはサポートされません。

InfoInfo:フォルダパスは大文字と小文字が区別されます。
  • サブフォルダを含める : ファイル検索時にサブフォルダも対象に含めたい場合は、サブフォルダを含める チェックボックスを選択できます。

  • ファイルパターン : サイト内のファイル名を照合するために使用するパターンです。正規表現形式のマッチングをサポートします。指定したパス内の任意のファイルに一致させるには、パターン「.*」を使用することもできます。
    InfoInfo:ファイルパターンは大文字と小文字が区別されます。
メモ: ファイルパターンの照合はシンプルな正規表現形式のマッチングです。たとえば、Sales_2022.csv、Sales_2023.csv、Sales_2024.csv というファイルを取得するには、パターン Sales_.* を入力します。

同様に、PublicData1.csv、PublicData2.csv、PublicData3.csv というファイルを取得するには、PublicData.* を使用します。

単一のファイルをインポートしたい場合は、正確なファイル名を使用してパターンを指定します。
例: leads_jan_2022.*
  • ファイルパスワード: ファイルがパスワード保護されている場合は、パスワードを入力します。

  • ファイルをマージしてインポート - 指定したパターンに一致するすべてのファイルをマージし、1 つのデータセットとしてインポートします。
    Idea重要: このオプションを使用すると、インポート時にファイルをまとめてマージでき、インポート後にユニオン処理を行う必要がありません。
    Info情報:このオプションで一度にマージできるファイルは最大 5 件までです。
    Notesメモ: このチェックボックスをオフにした場合は、一度に取得されるファイルは 1 件のみです。

    例: SharePoint アカウントに 10 個のファイルがある場合、最初の 5 個が 1 つのデータセットにマージされてインポートされます。次回の更新時に、残りの 5 個がマージされてインポートされます。

    同様に、SharePoint アカウントに 8 個のファイルがある場合、最初の 5 個が先にマージ・取得され、その後に残りの 3 個が処理されます。

  • ファイルの種類: 必要なファイル形式を選択します。利用可能な形式は、CSV、TSV、JSON、XLS、XLSX、XML、TXT です。
  • シートパターン: このオプションは XLS および XLSX 形式でのみ利用できます。 ファイル内のシート名に対して照合に使用するパターンです。正規表現形式でのマッチングをサポートします。任意のシートに一致させるには、パターン「.*」を使用できます。

    Notes
    シートパターンの照合もシンプルな正規表現ベースのマッチングです。例えば、Sales_2022、Sales_2023、Sales_2024 という名前のシートを取得するには、パターンとして「Sales_.*」を入力します。

    同様に、PublicData1、PublicData2、PublicData3 などのシートを取得するには、「PublicData.*」を使用します。

    単一のシートのみをインポートしたい場合は、そのシート名と完全に一致するパターンを指定してください。
    例: Leads_Jan_2022.*

  • Info
    情報: シートパターンは大文字と小文字を区別します。

  • シートパスワード: このオプションは XLS および XLSX 形式でのみ利用できます。シートがパスワード保護されている場合は、パスワードを入力します。
  • シートをマージしてインポート: 指定したパターンに一致するすべてのシートをマージし、1 つのデータセットとしてインポートします。

Idea
このオプションを使用すると、インポート時にシートをまとめてマージでき、インポート後にユニオン処理を行う必要がありません。

Notesメモ: このチェックボックスをオフにした場合は、一度に取得されるシートは 1 枚のみです。

3.  インポート ボタンをクリックします。



Notes
メモ: 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルもインポートできます。

ZIP ファイルの場合は、1 つのファイルのみがサポートされます。.zip ファイル内に圧縮されているファイルが 1 つだけであることを確認してください。
 

ファイル解析

ファイル解析とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。

ファイル解析には、自動解析カスタム解析の 2 つの設定があります。

  1. 自動解析 - ファイル構造(区切り文字、ヘッダー、エンコーディングなど)を自動検出し、それに応じてデータを整形します。
  2. カスタム解析 - ファイルの読み取り方法を手動で設定でき、区切り文字、ヘッダー、エンコーディングなどの設定を完全に制御できます。

カスタム解析には、次の設定が含まれます。

  • ファイルエンコーディング: ファイルエンコーディングオプションを使用して、UTF-8 などの文字エンコーディング方式でファイルをエンコードできます。

  • テキスト修飾子: シングルクォート (') やダブルクォート (') など、テキスト項目の開始と終了を示す文字を指定できます。

  • 区切り文字: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できるカスタム区切り文字オプションもあります。

  • 先頭行をスキップ: ファイルの先頭から指定した行数の解析をスキップします。

  • コメント文字: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。

  • エスケープ文字: 区切り文字や引用符をエスケープし、通常のテキストとして扱うために使用する文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。

  • スペースを自動的にトリム: データインポート時に、すべての列の前後の空白文字を削除します。

  • データにヘッダー行を含む: 列ヘッダーとして使用する行番号を指定します。

ファイル解析設定

以下の表では、クラウドストレージサービス向けのファイルインポート設定について説明します。



関連情報

新しいパイプラインを追加する方法?

クラウドデータベースからデータをインポートする方法

保存済みデータ連携を使用してデータをインポートする方法

パイプラインをスケジュールする方法        

Zoho DataPrep で利用できるその他のクラウドストレージ設定 

SharePoint にデータをエクスポートする方法