15:: 情報: パイプラインビルダー上部の16:: データをインポート
23:: メモ: 以前に Google ドライブの接続を追加している場合は、左側のペインで 24:: 保存済み接続25:: カテゴリーをクリックして、インポートを続行できます。保存済み接続の詳細については、26:: こちら27:: をクリックしてください。
30:: メモ: 31:: 32:: 新規追加33:: リンクをクリックして、新しい Google ドライブアカウントを追加します。必要に応じて、複数の Google ドライブ接続を作成できます。
34:: 4. Google アカウントを認証します。初めて実行する場合は、ファイルへアクセスするために DataPrep に権限を付与する必要があります。
36:: 5. インポートするファイルを選択し、37:: インポート 38:: ボタンをクリックします。38:: また、39:: 自分と共有済み または Shared Drive40:: タブからファイルを選択することもできます。 41:: また、詳細選択オプションを使用して、特定のパターンに一致するファイルをインポートすることもできます。 42:: こちらをクリック43:: して詳細を確認してください。
53:: 7. ファイルがパスワード保護されている場合は、パスワードを入力し、54:: 右矢印をクリックします。
59:: 9. データのインポートが完了すると、60:: 61:: パイプラインビルダー 62:: ページが開き、変換を適用し始めることができます。ステージを右クリックして、63:: データの準備64:: オプションを選択し、 65:: DataPrep Studio ページでデータを準備することもできます。66:: こちらをクリック 67:: して、利用できる変換について詳しく確認してください。
71:: メモ: パイプラインに出力先を追加した後は、72:: まず手動実行でパイプラインを実行してみてください。手動実行が問題なく動作することを確認したら、73:: スケジュール74:: を設定してパイプラインを自動化できます。さまざまな実行タイプについては 75:: こちら76:: を参照してください。
79:: 1. 80:: 詳細選択 81:: リンクをクリックします。
82:: 詳細選択では、正規表現(regex)に基づいて動的にファイルを選択できます。これは、 83:: Google Drive フォルダーから新規または増分データを取得する場合に便利です。指定したデータ期間中にファイルパターンに一致する、新規追加または更新済みのファイルが、 84:: Google Drive フォルダーから取得されます。 85:: 増分取得の詳細については、86:: こちらをクリックしてください。
91:: 2. 次の詳細を入力します。
92:: フォルダーを選択 93:: 94:: : データをインポートする 95:: フォルダーを選択します。
102:: 情報: 103:: フォルダーパス 104:: は大文字と小文字が区別されます。
105:: サブフォルダーを含める106:: : ファイル検索時にサブフォルダーも対象に含めたい場合は、 107:: サブフォルダーを含める 108:: チェックボックスを選択します。 109:: こちらをクリック110:: して、このオプションの制限事項を確認してください。
114:: 情報: 115:: ファイルパターンは大文字と小文字が区別されます。
116:: メモ: 117:: ファイルパターンのマッチングは、シンプルな正規表現ベースのマッチングです。たとえば、次のようなファイル名のファイルを取得するには 118:: 119:: Sales_2022。csv , Sales_2023。csv , Sales_2024。csv 120:: のように、パターン 121:: Sales_.*
122:: 同様に、次のようなファイルを取得するには 123:: PublicData1。csv , PublicData2。csv , PublicData3。csv 124:: 、パターン 125:: PublicData.* を使用します。
126:: 単一ファイルのみをインポートする場合は、 127:: 正確なファイル名をパターンとして指定してください。
128:: 例: 129:: leads_jan_2022.*
130:: ファイルパスワード: 131:: ファイルがパスワード保護されている場合は、パスワードを入力します。
134:: このオプションを使用すると、インポート時にファイルをまとめて結合でき、インポート後に結合処理(ユニオン)を行う必要がありません。
135:: 情報:136:: このオプションで一度に結合できるファイルは最大 5 件までです。
137:: メモ: 138:: このチェックボックスをオフにした場合は、一度に 1 件のファイルのみが取得されます。
159:: メモ: 160:: このチェックボックスをオフにした場合は、一度に 1 件のシートのみが取得されます。
167:: ファイル解析168:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。
169:: 170:: ファイル解析171:: には、172:: 自動解析173:: と 174:: カスタム解析175:: の 2 つの設定があります。
180:: カスタム解析181:: では、次の設定を利用できます。
182:: ファイルエンコーディング:183:: ファイルエンコーディングのオプションから UTF-8 などの184:: 文字エンコーディング方式185:: を使用してファイルをエンコードできます。
186:: テキスト修飾子:187:: シングルクォート (') やダブルクォート (') など、テキスト項目の開始と終了を示す文字を指定できます。
188:: 区切り文字:189:: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字を使用してデータを分割できます。独自の区切り文字を定義できる190:: カスタム区切り文字191:: オプションもあります。
192:: 先頭行をスキップ:193:: ファイルの先頭から指定した行数を解析対象からスキップします。
194:: コメント文字:195:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。
196:: エスケープ文字:197:: 区切り文字や引用符を通常のテキストとして扱うためにエスケープする文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。
198:: スペースを自動的にトリム:199:: データインポート時に、すべての列の前後の空白文字を削除します。
200:: データにヘッダー行を含む:201:: 列ヘッダーとして使用する行番号を指定します。
205:: 1. 206:: 207:: サブフォルダーを含める 208:: オプションを使用すると、 209:: 単一のサブフォルダー、または 210:: 全体の211:: マイドライブ 212:: 共有アイテム 213:: または 214:: 共有ドライブ 215:: フォルダー 216:: のすべてのサブフォルダーからのみ 217:: ファイルを取得できます。 218:: 特定のフォルダー内にあるすべてのサブフォルダーからファイルを取得することはできません。
219:: 2. 220:: 単一の 221:: サブフォルダー223:: からファイルを取得するには: フォルダーパスにサブフォルダーの正確なパスを入力します。 225:: 例: 226:: 2023/jan227:: / 228:: 必須項目を入力します。指定したファイルパターンに一致するファイルが、指定したフォルダーから取得されます。
242:: 関連情報
245:: クラウドデータベースからデータをインポートする方法
246:: 保存済みデータ接続からデータをインポートする方法