26:: 情報: パイプラインビルダー上部の 27:: データをインポート
36:: メモ: 以前に 37:: Amazon S338:: 接続を追加済みの場合は、左側のペインで 39:: 保存済み接続40:: カテゴリをクリックして、そのままインポートを続行できます。保存済み接続の詳細については、41:: こちら42:: をクリックしてください。
60:: 61:: 新規追加62:: リンクをクリックして、新しい Amazon S3 アカウントを追加します。必要に応じて、複数の Amazon S3 接続を作成できます。
74:: 9. データのインポートが完了すると、 75:: パイプラインビルダー 76:: ページが開き、変換の適用を開始できます。ステージを右クリックして、77:: データを準備78:: オプションを選択し、 79:: DataPrep Studio ページでデータを準備することもできます。80:: こちらをクリック 81:: して、利用できる変換について詳しく確認してください。
85:: メモ: パイプラインに出力先を追加した後は、86:: まず手動実行でパイプラインを実行してみることをおすすめします。手動実行で問題なく動作することを確認したら、87:: スケジュール88:: を設定してパイプラインを自動化できます。さまざまな実行タイプについては89:: こちら90:: を参照してください。
92:: 詳細選択を使用してファイルをインポートするには、次の操作を行います。
100:: 2. 次の詳細を入力します。
101:: バケット名 102:: : データをインポートする対象のバケット名を指定します。
109:: Info: 110:: フォルダパスは大文字と小文字が区別されます。
111:: ファイルパターン 112:: : バケット内のファイル名を照合するためのパターンです。正規表現形式のマッチングをサポートしています。指定したパス内の任意のファイルに一致させるには、' .* ' というパターンを使用できます。
113:: Info: 114:: ファイルパターンは大文字と小文字が区別されます。
115:: メモ: ファイルパターンの照合はシンプルな正規表現形式のマッチングです。たとえば、Sales_2022.csv、Sales_2023.csv、Sales_2024.csv というファイル名のファイルを取得するには、パターンとして 116:: Sales_.* を入力します。
117:: 同様に、PublicData1.csv、PublicData2.csv、PublicData3.csv などのファイルを取得するには、118:: PublicData.* を使用します。
119:: 単一のファイルのみをインポートしたい場合は、そのファイル名を正確に指定したパターンを入力してください。
120:: 例: leads_jan_2022.*
121:: サブフォルダを含める 122:: : ファイル検索時にサブフォルダも対象に含めたい場合は、 123:: サブフォルダを含める 124:: チェックボックスを選択します。
130:: Info:131:: このオプションで一度にマージできるファイルは最大 5 件までです。
132:: メモ: このチェックボックスをオフにした場合は、1 回の実行で取得されるファイルは 1 件のみです。
152:: メモ: このチェックボックスをオフにした場合は、1 回につき 1 つのシートのみが取得されます。
156:: メモ: 対応形式は CSV、TSV、JSON、XML、TXT、XLS、XLSX です。ZIP 形式のファイルをインポートすることもできます。 159:: ファイル解析160:: とは、インポート時にファイルを解釈して構造化し、データを処理用に正しく行と列に整理するプロセスです。
161:: 162:: ファイル解析163:: には、164:: 自動解析165:: と 166:: カスタム解析167:: の 2 つの設定があります。
172:: カスタム解析173:: では、次の設定を利用できます。
174:: ファイルエンコーディング:175:: File Encoding オプションを使用して、UTF-8 などの176:: 文字エンコーディング方式177:: でファイルをエンコードできます。
178:: テキスト修飾子:179:: シングルクォート (') やダブルクォート (') など、テキスト項目の開始と終了を示す文字を指定できます。
180:: 区切り文字:181:: カンマ ( , )、セミコロン ( ; )、スペース、タブ、パイプ ( | ) などの区切り文字でデータを分割できます。独自の区切り文字を定義できる182:: カスタム区切り文字183:: オプションもあります。
184:: 先頭行をスキップ:185:: ファイルの先頭から指定した行数の解析をスキップします。
186:: コメント文字:187:: コメント行の先頭文字を指定します。コメント行はインポート時にスキップされます。
188:: エスケープ文字:189:: 区切り文字や引用符を通常のテキストとして扱うために使用する文字を指定します。利用可能な設定には、ダブルクォート (')、バックスラッシュ (\)、パイプ (|)、キャレット (^)、チルダ (~) があります。
190:: スペースを自動的にトリム:191:: データインポート時に、すべての列の前後の空白文字を削除します。
192:: データにヘッダー行を含む:193:: 列ヘッダーとして使用する行番号を指定します。