Googleドライブからのデータインポート

Googleドライブからのデータインポート

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。



0:: Zoho DataPrep では、Google が提供するオンラインストレージおよび同期サービスである Google ドライブからデータをインポートできます。Google ドライブを使用すると、ユーザーはファイルをクラウドに保存し、デバイス間で同期し、ファイルを共有できます。

 1:: Google ドライブからデータをインポートするには

2:: 1.3:: 既存のパイプラインを開くか、4:: c5:: reate a pipeline6:: します。7:: ホーム8:: ページ、9:: Pipelines10:: タブ、または 11:: Workspaces12:: タブから操作し、13:: データを追加14:: オプションをクリックします。
Info15:: 情報: パイプラインビルダー上部の16:: データをインポート 17:: アイコンをクリックして、複数のソースからパイプラインにデータを取り込むこともできます。




18:: 2. 左側のペインで 19:: クラウドストレージ20:: カテゴリーを選択し、21:: Google Drive22:: アイコンをクリックして、Google ドライブからインポートします。必要なクラウドストレージサービスは、検索ボックスで検索することもできます。
 


Notes23:: メモ: 以前に Google ドライブの接続を追加している場合は、左側のペインで 24:: 保存済み接続25:: カテゴリーをクリックして、インポートを続行できます。保存済み接続の詳細については、26:: こちら27:: をクリックしてください。

28:: 3. 29:: 接続をすでに追加している場合は、既存の接続をクリックしてデータのインポートを開始します。


30:: メモ: 31:: 32:: 新規追加33:: リンクをクリックして、新しい Google ドライブアカウントを追加します。必要に応じて、複数の Google ドライブ接続を作成できます。

 

34:: 4. Google アカウントを認証します。初めて実行する場合は、ファイルへアクセスするために DataPrep に権限を付与する必要があります。



35:: メモ: 接続設定は、今後 Google ドライブからインポートする際に使用できるよう保存されます。認証情報は安全に暗号化されて保存されます。

 

36:: 5. インポートするファイルを選択し、37:: インポート 38:: ボタンをクリックします。38:: また、39:: 自分と共有済み または Shared Drive40:: タブからファイルを選択することもできます。 41:: また、詳細選択オプションを使用して、特定のパターンに一致するファイルをインポートすることもできます。 42:: こちらをクリック43:: して詳細を確認してください。

44:: 自分と共有済み45:: - このタブには、自分個人と共有されているファイルが表示されます。
46:: Shared drives47:: - Google ドライブの Shared Drive は、チームがファイルを保存、アクセス、共同編集できる共有スペースです。チームと共有されているファイルがここに表示されます。


 

 
Notes
48:: メモ: Shared drives と 自分と共有済み タブは、アカウントが Shared Drive または自分と共有されているファイルにアクセス権を持っている場合にのみ表示されます。

49:: 6. 50:: HTML、XLS、または XLSX ファイルの場合は、51:: プレビュー52:: オプションをクリックして、データのサンプルを表示できます。

 

53:: 7. ファイルがパスワード保護されている場合は、パスワードを入力し、54:: 右矢印をクリックします。

 

 

55:: 8. 56:: 57:: インポート58:: ボタンをクリックします。



59:: 9. データのインポートが完了すると、60:: 61:: パイプラインビルダー 62:: ページが開き、変換を適用し始めることができます。ステージを右クリックして、63:: データの準備64:: オプションを選択し、 65:: DataPrep Studio ページでデータを準備することもできます。66:: こちらをクリック 67:: して、利用できる変換について詳しく確認してください。




68:: 10. データフローの作成と、各ステージで必要な変換の適用が完了したら、ステージを右クリックして69:: 出力先を追加70:: し、データフローを完了します。

Notes71:: メモ: パイプラインに出力先を追加した後は、72:: まず手動実行でパイプラインを実行してみてください。手動実行が問題なく動作することを確認したら、73:: スケジュール74:: を設定してパイプラインを自動化できます。さまざまな実行タイプについては 75:: こちら76:: を参照してください。

 

77:: 詳細選択

78:: 詳細選択を使用してファイルをインポートするには、次の操作を行います。

79:: 1.  80:: 詳細選択 81:: リンクをクリックします。


82:: 詳細選択では、正規表現(regex)に基づいて動的にファイルを選択できます。これは、 83:: Google Drive フォルダーから新規または増分データを取得する場合に便利です。指定したデータ期間中にファイルパターンに一致する、新規追加または更新済みのファイルが、 84:: Google Drive フォルダーから取得されます。 85:: 増分取得の詳細については、86:: こちらをクリックしてください。

87:: 重要: 詳細選択は、増分取得だけでなく、ファイルパターンに基づく一括インポートにも使用できます。
Notes
88:: メモ: 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルをインポートすることもできます。
89:: ZIP ファイルの場合、サポートされるのは 1 つのファイルのみです。.zip ファイル内に圧縮されているファイルが 1 つだけであることを確認してください。
Notes
90:: ファイルを一括インポートする場合、ごみ箱内のファイルも完全に削除されていない限りインポートされます。これを避けるには、ごみ箱から対象ファイルを削除しておいてください。



91:: 2. 次の詳細を入力します。

  • 92:: フォルダーを選択 93:: 94:: : データをインポートする 95:: フォルダーを選択します。

  • 96:: フォルダーパス97:: : ファイルを検索するフォルダーのパスです。例: 2023/ 
    98:: ファイルがフォルダーではなく 99:: ドライブ 100:: 直下に保存されている場合、この項目は空のままにできます。
    Alert
    101:: 「フォルダーパス」はディレクトリパス項目であり、正規表現パターンはサポートしていません。
    Info102:: 情報: 103:: フォルダーパス 104:: は大文字と小文字が区別されます。

  • 105:: サブフォルダーを含める106:: : ファイル検索時にサブフォルダーも対象に含めたい場合は、 107:: サブフォルダーを含める 108:: チェックボックスを選択します。 109:: こちらをクリック110:: して、このオプションの制限事項を確認してください。

  • 111:: ファイルパターン112:: : フォルダー内のファイル名を照合するために使用するパターンです。正規表現タイプのマッチングをサポートしています。指定したパス内の任意のファイルに一致させるには、'.*' パターンを使用することもできます。
  • Info114:: 情報: 115:: ファイルパターンは大文字と小文字が区別されます。

116:: メモ: 117:: ファイルパターンのマッチングは、シンプルな正規表現ベースのマッチングです。たとえば、次のようなファイル名のファイルを取得するには 118:: 119:: Sales_2022。csv , Sales_2023。csv , Sales_2024。csv 120:: のように、パターン 121:: Sales_.* 


122:: 同様に、次のようなファイルを取得するには 123:: PublicData1。csv , PublicData2。csv , PublicData3。csv 124:: 、パターン 125:: PublicData.* を使用します。


126:: 単一ファイルのみをインポートする場合は、
 127:: 正確なファイル名をパターンとして指定してください。
128:: 例: 129:: leads_jan_2022.*

  • 130:: ファイルパスワード: 131:: ファイルがパスワード保護されている場合は、パスワードを入力します。

  • 132:: ファイルを結合してインポート 133:: - 指定したパターンに一致するすべてのファイルを結合し、1 つのデータセットとしてインポートします。
    Idea134:: このオプションを使用すると、インポート時にファイルをまとめて結合でき、インポート後に結合処理(ユニオン)を行う必要がありません。
    Info135:: 情報:136:: このオプションで一度に結合できるファイルは最大 5 件までです。
    Notes137:: メモ: 138:: このチェックボックスをオフにした場合は、一度に 1 件のファイルのみが取得されます。
    139:: 例: Google Drive 140:: アカウントに 10 件のファイルがある場合、最初の 5 件が 1 つのデータセットに結合されてインポートされます。次回の更新時に、残りの 5 件が結合されてインポートされます。

    141:: 同様に、Google Drive 142:: アカウントに 8 件のファイルがある場合、最初の 5 件が先に結合・取得され、その後に残りの 3 件が結合・取得されます。 
  • 143:: ファイルの種類144:: : 145:: 必要なファイル形式を選択します。利用可能な形式は、CSV、TSV、JSON、XLS、XLSX、XML、TXT です。
  • 146:: シートパターン147:: : このオプションは XLS および XLSX 形式でのみ利用できます。 148:: ファイル内のシート名に対してマッチングを行うためのパターンです。正規表現形式のマッチングをサポートします。ファイル内の任意のシートにマッチさせるには、パターン「.*」を使用することもできます。
    Notes
    149:: シートパターンのマッチングも、シンプルな正規表現ベースのマッチングです。たとえば、Sales_2022、Sales_2023、Sales_2024 のような名前のシートを取得するには、パターン Sales_.* を入力します。

    150:: 同様に、PublicData1、PublicData2、PublicData3 のようなシートを取得するには、PublicData.* を使用します。

    151:: 単一のシートのみをインポートする場合は、そのシート名を正確に指定してパターンを設定してください。
    152:: 例: Leads_Jan_2022.*
  • Info
    153:: 情報: シートパターンは大文字と小文字を区別します。

  • 154:: シートパスワード155:: : このオプションは XLS および XLSX 形式でのみ利用できます。シートがパスワード保護されている場合は、パスワードを入力します。
  • 156:: シートを結合してインポート157:: : 指定したパターンに一致するすべてのシートを結合し、1 つのデータセットとしてインポートします。

Idea
158:: このオプションを使用すると、インポート時にシートをまとめて結合でき、インポート後に結合処理(ユニオン)を行う必要がありません。

Notes159:: メモ: 160:: このチェックボックスをオフにした場合は、一度に 1 件のシートのみが取得されます。
161:: 3.  162:: インポート163:: ボタンをクリックします。



Notes
164:: メモ: 対応している形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルをインポートすることもできます。

165:: ZIP ファイルの場合は、1 つのファイルのみがサポートされます。.zip ファイル内に圧縮されているファイルが 1 つだけであることを確認してください。
 

166:: ファイル解析

167:: ファイル解析168:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。

169:: 170:: ファイル解析171:: には、172:: 自動解析173:: と 174:: カスタム解析175:: の 2 つの設定があります。

  1. 176:: 自動解析177:: - ファイル構造(区切り文字、ヘッダー、エンコーディングなど)を自動的に検出し、それに応じてデータを整形します。
  2. 178:: カスタム解析179:: - ファイルの読み取り方法を手動で設定でき、区切り文字、ヘッダー、エンコーディングなどの各種設定を細かく制御できます。

180:: カスタム解析181:: では、次の設定を利用できます。

  • 182:: ファイルエンコーディング:183:: ファイルエンコーディングのオプションから UTF-8 などの184:: 文字エンコーディング方式185:: を使用してファイルをエンコードできます。

  • 186:: テキスト修飾子:187:: シングルクォート (') やダブルクォート (') など、テキスト項目の開始と終了を示す文字を指定できます。

  • 188:: 区切り文字:189:: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できる190:: カスタム区切り文字191:: オプションもあります。

  • 192:: 先頭行をスキップ:193:: ファイルの先頭から指定した行数を解析対象からスキップします。

  • 194:: コメント文字:195:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。

  • 196:: エスケープ文字:197:: 区切り文字や引用符を通常のテキストとして扱うためにエスケープする文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。

  • 198:: スペースを自動的にトリム:199:: データインポート時に、すべての列の前後の空白文字を削除します。

  • 200:: データにヘッダー行を含む:201:: 列ヘッダーとして使用する行番号を指定します。

202:: ファイル解析設定

203:: 以下の表では、クラウドストレージサービス向けのファイルインポート設定について説明します。



204:: 制限事項

 
205:: 1. 206::  207:: サブフォルダーを含める 208:: オプションを使用すると、 209:: 単一のサブフォルダー、または 210:: 全体の211:: マイドライブ 212:: 共有アイテム 213:: または 
214:: 共有ドライブ 215:: フォルダー 216:: のすべてのサブフォルダーからのみ 217:: ファイルを取得できます。 218:: 特定のフォルダー内にあるすべてのサブフォルダーからファイルを取得することはできません。


219:: 2. 220:: 単一の 221:: サブフォルダー223:: からファイルを取得するには: フォルダーパスにサブフォルダーの正確なパスを入力します。 225:: 例: 226:: 2023/jan227:: / 228:: 必須項目を入力します。指定したファイルパターンに一致するファイルが、指定したフォルダーから取得されます。



229:: 3. Google ドライブのすべての 230:: サブフォルダーからファイルを取得するには: 231:: フォルダーパスを空のままにし、 232::  233:: サブフォルダーを含める 234:: チェックボックスを選択します。必須項目を入力します。 235:: 指定したファイルパターンに一致するファイルが、全体のすべてのサブフォルダーから取得されます。 236:: 対象は237:: マイドライブ 238:: 共有アイテム239:: および 240:: 共有ドライブ 241:: フォルダーです。

242:: 関連情報

243:: 新しいパイプラインを追加する方法244::

245:: クラウドデータベースからデータをインポートする方法

246:: 保存済みデータ接続からデータをインポートする方法

247:: パイプラインをスケジュールする方法        

248:: Zoho DataPrep で利用できるその他のクラウドストレージ設定 

249:: データを Google ドライブにエクスポートする方法