0:: Zoho DataPrep は、クラウドストレージサービスである Box からのデータインポートに対応しています。1:: Box を使用すると、ユーザーはファイルを保存し、共同作業を行い、 2:: セキュアに管理できます。3:: また、あらゆるデバイスからアクセス可能なオンラインフォルダーシステムとして利用できます。
18:: 情報: パイプラインビルダー上部の19:: データをインポート
29:: メモ: すでに Box 接続を追加済みの場合は、左側のペインで 30:: 31:: 32:: 保存済み接続33:: 34:: カテゴリーをクリックしてインポートを続行してください。保存済み接続の詳細については 35:: 、36:: こちら37:: を参照してください。
41:: メモ: 42:: 新しい Box アカウントを追加するには、43:: 新規追加44:: リンクをクリックします。必要に応じて、複数の Box 接続を作成できます。
45:: 4. Box アカウントを認証します。初めて認証する際は、DataPrep にファイルへのアクセスを許可する必要があります。
55:: メモ: Box の共有フォルダーからファイルをインポートすることもできます。56:: 57:: 58:: 共有されたファイルは、59:: My drive60:: タブにも表示されます61:: 。
66:: 7. 67:: ファイルがパスワードで保護されている場合は、パスワードを入力し、68:: 右矢印をクリックします。
73:: 9. データのインポートが完了すると、74:: 75:: Pipeline builder 76:: ページが開き、変換を適用し始めることができます。ステージを右クリックして、77:: Prepare data78:: オプションを選択し、 79:: DataPrep Studio ページでデータを準備することもできます。80:: こちらをクリック 81:: して、変換の詳細をご確認ください。
85:: メモ: パイプラインに出力先を追加したら、まず手動実行でパイプラインを実行してみてください。86:: 手動実行が問題なく動作することを確認したら、87:: スケジュール88:: を設定してパイプラインを自動化できます。さまざまな実行タイプについては 89:: こちら90:: をご覧ください。
93:: 1. 94:: Advanced selection 95:: リンクをクリックします。
96:: Advanced selection を使用すると、正規表現に基づいて動的にファイルを選択できます。これにより、97:: Box 98:: アカウントから新規または増分データを取得できます。 99:: 指定したデータ間隔中にファイルパターンに一致する、新規作成または更新済みのファイルが、100:: Box アカウントから取得されます。 101:: 詳細については、102:: インクリメンタルフェッチについての説明をご覧ください。
104:: 2. 次の内容を入力します。
109:: 情報: 110:: フォルダー path は大文字と小文字が区別されます。
111:: メモ112:: : 113:: Box で新しく作成されたファイルが DataPrep のインポート画面に反映されるまで、 114:: 最大 115:: 10 分かかる場合があります。
116:: サブフォルダーを含める117:: : ファイル検索時にサブフォルダーも対象に含めたい場合は、 118:: サブフォルダーを含める 119:: チェックボックスを選択します。
122:: 情報: 123:: ファイルパターンは大文字と小文字を区別します。
124:: メモ: ファイルパターンのマッチングはシンプルな正規表現ベースのマッチングです。たとえば、Sales_2022.csv、Sales_2023.csv、Sales_2024.csv というファイル名のファイルを取得するには、パターン 125:: Sales_.* を入力します。
126:: 同様に、PublicData1.csv、PublicData2.csv、PublicData3.csv などのファイルを取得するには、127:: Public.* を使用します。
128:: 単一のファイルのみをインポートする場合は、そのファイル名を正確に指定したパターンを入力してください。
129:: 例: leads_jan_2022.*
130:: ファイルパスワード: 131:: ファイルがパスワードで保護されている場合は、そのパスワードを入力します。
134:: 重要: このオプションを使用すると、インポート時にファイルをまとめてマージでき、インポート後に結合処理を行う必要がありません。
135:: 情報: 136:: このオプションで一度にマージできるファイルは最大 5 件までです。
137:: メモ: 138:: このチェックボックスをオフにした場合は、1 回につき 1 件のファイルのみ取得されます。
139:: 例: Box 140:: アカウントに 10 件のファイルがある場合、最初の 5 件が 1 つのデータセットにマージされてインポートされます。次回の再読み込み時に、残りの 5 件がマージされてインポートされます。
141:: 同様に、Box アカウントに 8 件のファイルがある場合は、最初の 5 件が先にマージ・取得され、その後に残りの 3 件がマージ・取得されます。
158:: メモ: 159:: このチェックボックスをオフにした場合は、1 回につき 1 件のシートのみ取得されます。
166:: ファイルパース167:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。
168:: 169:: ファイルパース170:: には、171:: 自動パース172:: と 173:: カスタムパース174:: の 2 つのオプションがあります。
179:: カスタムパース180:: では、次のオプションを利用できます。
181:: ファイルエンコーディング:182:: ファイルエンコーディングオプションを使用して、UTF-8 などの文字183:: エンコーディング方式184:: でファイルをエンコードできます。
185:: テキスト修飾子:186:: テキスト項目の開始と終了を示す文字(シングルクォート (') やダブルクォート (') など)を指定できます。
187:: 区切り文字:188:: コンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できる189:: カスタム区切り文字190:: オプションもあります。
191:: 先頭行をスキップ:192:: ファイルの先頭から指定した行数のパースをスキップします。
193:: コメント文字:194:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。
195:: エスケープ文字:196:: 区切り文字や引用符をエスケープし、書式なしテキストとして扱うための文字を指定します。利用可能なオプションには、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。
197:: スペースを自動的にトリム:198:: データインポート時に、すべての列の前後の空白文字を削除します。
199:: データにヘッダー行を含む:200:: 列ヘッダーとして使用する行番号を指定します。