ローカルファイルシステムからデータをインポートする

ローカルファイルシステムからデータをインポートする

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




DataPrepでは、CSV、TSV、JSON、HTML、XLS、XLSX、XMLなど、さまざまなファイル形式をインポートできます。このコネクターを利用することで、ETLワークフローを効率化し、スムーズなデータ移動とローカルファイルとZoho DataPrep間のデータ統合を簡単に行うことが可能です。

Notes
メモ :
1. DataPrepは、拡張子のないファイルやプレーンテキスト形式のファイルにも対応しています。ただし、バイナリファイルはインポート時にパースできません。ユーザーは上記の対応形式のいずれかに手動で変換する必要があります。
2. インポート時に対応するローカルファイルの最大サイズは100MBです。その他の技術的な制限についてはこちらをご覧ください。

ローカルファイルをインポートする方法

1. パイプラインを作成するか、ホームページ、Pipelinesタブ、Workspacesタブから既存のパイプラインを開き、データ追加オプションをクリックします。また、Workspacesタブ内のデータをインポートオプションからもデータをインポートできます。
Info
情報: パイプラインビルダーの上部にあるデータをインポートアイコンをクリックすることで、複数のソースからパイプラインへデータを取り込むことも可能です。



2. データ元の選択Filesオプションを選択します。または、左側のペインからFilesカテゴリーをクリックしてファイルをアップロードし、下記のいずれかの設定を選択できます。
  • Files
  • URL
  • FTP


3. ファイルを「アップロードする」ボックスにドラッグ&ドロップするか、クリックしてファイルを選択します。特定のファイルパターンに基づいてローカルファイルを段階的にインポートしたい場合は、ローカルネットワークからインポートするトグルを有効にできます。詳細はこちらをクリックしてください。
Notes
メモ : 郵便番号ファイルの場合、1つのファイルのみ対応しています。.郵便番号ファイル内には1つだけファイルを圧縮・保存してください。





Info また、 サンプルを試す リンクをクリックしてサンプルデータセットをインポートし、動作を確認できます。

4. 追加されたファイルはファイルサイズとともに表示されます。さらにファイルを追加したり、既存のファイルを削除することも可能です。
Notes
メモ : HTMLファイルの場合、インポートするデータの選択はHTMLページ内のテーブルの順序によって決まります。



5. すべてのファイルを選択したら、インポートするをクリックします。アップロードの進行状況が表示されます。

6. ファイルがHTML、XLS、XLSXまたはパスワード保護されたファイルの場合、ユーザーはパスワードを入力し、インポートするボタンをクリックしてインポートを完了する前にファイルをプレビューできます。



7. すべてのファイルのインポートが完了すると、Pipeline builderページに移動し、ETLパイプラインへの変換適用を開始できます。また、ステージを右クリックしてデータの準備オプションを選択し、DataPrep Studioページでデータ準備を行うことも可能です。変換についてはこちらをクリックしてください。



8. データフローの作成と各ステージで必要な変換を完了したら、ステージを右クリックして宛先を追加し、データフローを完成させます。

Notesメモ: ETLパイプラインに宛先を追加した後は、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定して、パイプラインとデータ移動を自動化できます。各実行タイプについてはこちらをご覧ください。
Notes
メモ
1. 各ファイルはワークスペース内で個別のデータセットとして作成されます。
2. ファイルがパスワードで保護されている場合、DataPrepはファイルを開くためのパスワード入力を求めます。このパスワードは保存されず、パスワード保護されたファイルを開く際だけに使用されます。
3. Excelファイルをアップロードする場合、DataPrepではファイル内の個別の表計算シートを選択してインポートできます。また、インポート前に表計算シートのプレビューも可能です。


ローカルネットワークからファイルをインポートする方法

ローカルネットワークからインポートするトグルを利用すると、正規表現に基づいた動的ファイル選択が可能です。この機能は、ローカルファイルシステムから新規または増分データを取得する際に利用できます。増分取得は、前回の同期以降にデータ元から新規ファイルをインポートする方法です。Zoho DataPrepでは、Zoho Databridgeを使用してローカルファイルから増分データをインポートできます。

Info
重要: このオプションは増分フェッチだけでなく、ファイルパターンに基づく一括インポートにも使用できます。

DataPrep では、CSV、TSV、JSON、XML、XLS、XLSX、TXT など、さまざまなファイル形式を増分でインポートできます。

1. 特定のファイルパターンに基づいてローカルファイルを増分インポートしたい場合は、ローカルネットワークからのインポートトグルを有効にしてください。


Info
情報: ローカルファイルをインポートするには、お使いのマシンに Zoho Databridge がインストールされていることを確認してください。こちらをクリックすると、Zoho Databridge のダウンロードおよびインストール方法をご確認いただけます。



2. 有効な Databridge を選択し、次の詳細情報を入力してください。

フォルダーパス: ファイルを検索したいフォルダーパスを入力してください。例:D:\DataPrep\Datasets

Info
情報: フォルダパスは大文字と小文字を区別します。

含める subfolders: ファイル検索時に subfolders も含めたい場合は、このチェックボックスを選択してください。

File pattern: 指定した場所のファイル名を照合するためのパターンです。正規表現によるマッチングもサポートしています。パス内の任意のファイルを照合したい場合は '.*' のパターンも利用できます。

Merge files and インポートする: 指定したパターンに一致するすべてのファイルを結合し、1つのデータセットとしてインポートします。

File パスワード: ファイルがパスワード保護されている場合は、パスワードを入力してください。

Info
情報: ファイルパターンは大文字と小文字を区別します。
Notes

メモ:ファイルパターン「照合する」はシンプルなregex種類の照合となります。例えば、Sales_2022.csv,Sales_2023.csv, Sales_2024.csvといったファイル名を取得したい場合は、パターンSales_.*を入力します。

同様に、PublicData1.csv、PublicData2.csv、PublicData3.csvなどのファイルを取得する場合は、公開する.*

単一ファイルをインポートする場合は、正確なファイル名でパターンを指定してください。
例:leads_jan_2022.*


ファイルの種類: 必須となるファイル形式を選択してください。利用可能な形式は CSV、TSV、JSON、XLS、XLSX、XML、TXT です。

Sheet pattern: このオプションは、XLS および XLSX 形式でのみ利用可能です。 パターンを使用してファイル内のシート名を照合します。正規表現によるマッチングに対応しています。すべてのシートにマッチさせたい場合は '.*' をパターンとして使用できます。

シートパターンによる照合は、シンプルな正規表現ベースのマッチングです。例えば、Sales_2022、Sales_2023、Sales_2024 などのシート名を取得したい場合は、パターンに Sales_.* と入力します。

同様に、PublicData1、PublicData2、PublicData3 などのシートを取得したい場合は、公開する.* を使用してください。

特定の1つのシートのみをインポートしたい場合は、パターンに正確なシート名を指定してください。
例: Leads_Jan_2022.*

補足: シートパターンは大文字・小文字を区別します。

Sheet パスワード: このオプションは XLS および XLSX 形式でのみ利用可能です。シートがパスワード保護されている場合は、パスワードを入力してください。
Merge 表計算シートとインポートする:指定されたパターンに一致するすべての表計算シートを結合し、1つのデータセットとしてインポートします。


Idea
このオプションを使用すると、インポート時に表計算シートをまとめて結合でき、インポート後にユニオン処理を行う必要がありません。


Notesメモ: このチェックボックスがオフの場合、一度に取得できるのは1つのシートのみです。
3. インポートするボタンをクリックします。

関連項目
ローカルファイルから増分データをインポートする方法
FTPサーバーからデータをインポートする方法
URLからデータをインポートする方法  
技術的な制限事項