Zoho DataPrep は、クラウドストレージサービスである Box からのデータインポートに対応しています。このサービスを使用すると、ユーザーはファイルを安全に保存し、共同作業を行い、 オンライン上のフォルダーシステムで管理できます。このフォルダーシステムには、あらゆるデバイスからアクセスできます。
Info: パイプラインビルダー上部のデータをインポート
メモ: 以前に Box の接続を追加している場合は、左側のペインでSaved connections カテゴリをクリックし、そのままインポートを続行できます。保存済みの 外部連携の詳細については、こちらをクリックしてください。
メモ: 新しい Box アカウントを追加するには、新規追加リンクをクリックします。必要に応じて、複数の Box 外部連携を作成できます。
4. Box アカウントを認証します。初めて実行する場合は、ファイルへアクセスできるよう DataPrep を認可する必要があります。
メモ: Box の共有フォルダーからファイルをインポートすることもできます。共有ファイルは、My drive タブにも表示されます。
7. ファイルがパスワードで保護されている場合は、パスワードを入力し、の右矢印をクリックします。
9. データのインポートが完了すると、Pipeline builder ページが開き、変換の適用を開始できます。また、ステージを右クリックしてPrepare dataオプションを選択し、 DataPrep Studio ページでデータを準備することもできます。こちらをクリック して、変換の詳細をご確認ください。
1. [詳細 selection]リンクをクリックします。
詳細 selection を使用すると、正規表現に基づいて動的にファイルを選択できます。これにより、Box アカウントから新規または増分データを取得することができます。指定したデータ間隔内に追加または更新され、ファイルパターンに一致するファイルが Box アカウントから取得されます。 インクリメンタルフェッチの詳細については、こちらをクリックしてください。
2. 次の詳細を入力します。
Info: Folder path は大文字と小文字が区別されます。
メモ: Box で最近作成されたファイルが DataPrep でのインポート時に反映されるまで、最大 10 分かかる場合があります。
含める subfolders: ファイル検索時にサブフォルダーも含めたい場合は、含める subfolders チェックボックスを選択します。
Info: File pattern は大文字と小文字が区別されます。
メモ: File pattern の照合はシンプルな正規表現形式のマッチングです。たとえば、Sales_2022.csv、Sales_2023.csv、Sales_2024.csv というファイルを取得するには、パターン Sales_.* を入力します。
同様に、PublicData1.csv、PublicData2.csv、PublicData3.csv などのファイルを取得するには、PublicData.* を使用します。
単一のファイルをインポートする場合は、正確なファイル名を使用してパターンを指定します。
例: leads_jan_2022.*
File パスワード: ファイルがパスワードで保護されている場合は、パスワードを入力します。
Important: このオプションを使用すると、インポート時にファイルをまとめてマージでき、インポート後にユニオン処理を行う必要がありません。
Info: このオプションで一度にマージできるファイルは最大 5 件までです。
メモ: このチェックボックスをオフにした場合、一度に取得されるファイルは 1 件のみです。
例: Box アカウントに 10 個のファイルがある場合、最初の 5 個が 1 つのデータセットにマージされてインポートされます。次回の更新時に、残りの 5 個がマージされてインポートされます。
同様に、Box アカウントに 8 個のファイルがある場合、最初の 5 個が先にマージ・取得され、その後に残りの 3 個が処理されます。
メモ: このチェックボックスをオフにした場合、一度に取得されるシートは 1 つのみです。
ファイル解析とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。
ファイル解析には、自動解析とカスタム解析の 2 つの設定があります。
カスタム解析には、次の設定が含まれます。
ファイルエンコーディング: ファイルエンコーディングオプションを使用して、UTF-8 などの文字エンコーディング方式でファイルをエンコードできます。
テキスト修飾子: シングルクォート (') やダブルクォート (') など、テキスト項目の開始と終了を示す文字を指定できます。
区切り文字: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できるカスタム区切り文字オプションもあります。
先頭行をスキップ: ファイルの先頭から指定した行数分の解析をスキップします。
コメント文字: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。
エスケープ文字: 区切り文字や引用符を通常のテキストとして扱うために使用する文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。
スペースを自動的にトリム: データインポート時に、すべての列の先頭および末尾の空白文字を削除します。
データにヘッダー行を含む: 列ヘッダーとして使用する行番号を指定します。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。