ローカルファイルシステムからデータをインポートする
お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
DataPrepでは、CSV、TSV、JSON、HTML、XLS、XLSX、XMLなど、さまざまなファイル形式をインポートできます。このコネクターを利用することで、ETLワークフローを効率化し、スムーズなデータ移動とローカルファイルとZoho DataPrep間のデータ統合を簡単に行うことが可能です。
メモ :
1. DataPrepは、拡張子のないファイルやプレーンテキスト形式のファイルにも対応しています。ただし、バイナリファイルはインポート時にパースできません。ユーザーは上記の対応形式のいずれかに手動で変換する必要があります。
ローカルファイルをインポートする方法
1.
パイプラインを作成するか、
ホームページ、
Pipelinesタブ、
Workspacesタブから既存のパイプラインを開き、
データ追加オプションをクリックします。また、
Workspacesタブ内の
データをインポートオプションからもデータをインポートできます。
情報: パイプラインビルダーの上部にある
データをインポート
アイコンをクリックすることで、複数のソースからパイプラインへデータを取り込むことも可能です。
2. データ元の選択でFilesオプションを選択します。または、左側のペインからFilesカテゴリーをクリックしてファイルをアップロードし、下記のいずれかの設定を選択できます。
3. ファイルを「アップロードする」ボックスにドラッグ&ドロップするか、クリックしてファイルを選択します。特定のファイルパターンに基づいてローカルファイルを段階的にインポートしたい場合は、
ローカルネットワークからインポートするトグルを有効にできます。詳細は
こちらをクリックしてください。
メモ : 郵便番号ファイルの場合、1つのファイルのみ対応しています。.郵便番号ファイル内には1つだけファイルを圧縮・保存してください。
また、 サンプルを試す リンクをクリックしてサンプルデータセットをインポートし、動作を確認できます。
4. 追加されたファイルはファイルサイズとともに表示されます。さらにファイルを追加したり、既存のファイルを削除することも可能です。
メモ : HTMLファイルの場合、インポートするデータの選択はHTMLページ内のテーブルの順序によって決まります。
5. すべてのファイルを選択したら、インポートするをクリックします。アップロードの進行状況が表示されます。
6. ファイルがHTML、XLS、XLSXまたはパスワード保護されたファイルの場合、ユーザーはパスワードを入力し、インポートするボタンをクリックしてインポートを完了する前にファイルをプレビューできます。
7. すべてのファイルのインポートが完了すると、
Pipeline builderページに移動し、ETLパイプラインへの変換適用を開始できます。また、ステージを右クリックして
データの準備オプションを選択し、
DataPrep Studioページでデータ準備を行うことも可能です。変換については
こちらをクリックしてください。
8. データフローの作成と各ステージで必要な変換を完了したら、ステージを右クリックして
宛先を追加し、データフローを完成させます。
メモ: ETLパイプラインに宛先を追加した後は、まず手動実行でパイプラインを実行してみてください。手動実行が正常に動作することを確認したら、スケジュールを設定して、パイプラインとデータ移動を自動化できます。各実行タイプについてはこちらをご覧ください。
メモ
1. 各ファイルはワークスペース内で個別のデータセットとして作成されます。
2. ファイルがパスワードで保護されている場合、DataPrepはファイルを開くためのパスワード入力を求めます。このパスワードは保存されず、パスワード保護されたファイルを開く際だけに使用されます。
3. Excelファイルをアップロードする場合、DataPrepではファイル内の個別の表計算シートを選択してインポートできます。また、インポート前に表計算シートのプレビューも可能です。
ローカルネットワークからファイルをインポートする方法
ローカルネットワークからインポートするトグルを利用すると、正規表現に基づいた動的ファイル選択が可能です。この機能は、ローカルファイルシステムから新規または増分データを取得する際に利用できます。増分取得は、前回の同期以降にデータ元から新規ファイルをインポートする方法です。Zoho DataPrepでは、Zoho Databridgeを使用してローカルファイルから増分データをインポートできます。
重要: このオプションは増分フェッチだけでなく、ファイルパターンに基づく一括インポートにも使用できます。
DataPrep では、CSV、TSV、JSON、XML、XLS、XLSX、TXT など、さまざまなファイル形式を増分でインポートできます。
1. 特定のファイルパターンに基づいてローカルファイルを増分インポートしたい場合は、ローカルネットワークからのインポートトグルを有効にしてください。
情報: ローカルファイルをインポートするには、お使いのマシンに Zoho Databridge がインストールされていることを確認してください。
こちらをクリックすると、Zoho Databridge のダウンロードおよびインストール方法をご確認いただけます。
2. 有効な Databridge を選択し、次の詳細情報を入力してください。
フォルダーパス: ファイルを検索したいフォルダーパスを入力してください。例:D:\DataPrep\Datasets
情報: フォルダパスは大文字と小文字を区別します。
含める subfolders: ファイル検索時に subfolders も含めたい場合は、このチェックボックスを選択してください。
File pattern: 指定した場所のファイル名を照合するためのパターンです。正規表現によるマッチングもサポートしています。パス内の任意のファイルを照合したい場合は '.*' のパターンも利用できます。
Merge files and インポートする: 指定したパターンに一致するすべてのファイルを結合し、1つのデータセットとしてインポートします。
File パスワード: ファイルがパスワード保護されている場合は、パスワードを入力してください。
情報: ファイルパターンは大文字と小文字を区別します。
メモ:ファイルパターン「照合する」はシンプルなregex種類の照合となります。例えば、Sales_2022.csv,Sales_2023.csv, Sales_2024.csvといったファイル名を取得したい場合は、パターンSales_.*を入力します。
同様に、PublicData1.csv、PublicData2.csv、PublicData3.csvなどのファイルを取得する場合は、公開する.*
単一ファイルをインポートする場合は、正確なファイル名でパターンを指定してください。
例:leads_jan_2022.*
ファイルの種類: 必須となるファイル形式を選択してください。利用可能な形式は CSV、TSV、JSON、XLS、XLSX、XML、TXT です。
Sheet pattern: このオプションは、XLS および XLSX 形式でのみ利用可能です。 パターンを使用してファイル内のシート名を照合します。正規表現によるマッチングに対応しています。すべてのシートにマッチさせたい場合は '.*' をパターンとして使用できます。
シートパターンによる照合は、シンプルな正規表現ベースのマッチングです。例えば、Sales_2022、Sales_2023、Sales_2024 などのシート名を取得したい場合は、パターンに Sales_.* と入力します。
同様に、PublicData1、PublicData2、PublicData3 などのシートを取得したい場合は、公開する.* を使用してください。
特定の1つのシートのみをインポートしたい場合は、パターンに正確なシート名を指定してください。
例: Leads_Jan_2022.*
補足: シートパターンは大文字・小文字を区別します。
Sheet パスワード: このオプションは XLS および XLSX 形式でのみ利用可能です。シートがパスワード保護されている場合は、パスワードを入力してください。
Merge 表計算シートとインポートする:指定されたパターンに一致するすべての表計算シートを結合し、1つのデータセットとしてインポートします。
このオプションを使用すると、インポート時に表計算シートをまとめて結合でき、インポート後にユニオン処理を行う必要がありません。
メモ: このチェックボックスがオフの場合、一度に取得できるのは1つのシートのみです。
3. インポートするボタンをクリックします。
関連項目