お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
DataPrep では、指定した入力内容に基づいて列を分割できます。選択した分割オプションに応じて、区切り文字を使い1つの列を複数の列に分割することが可能です。
「分割」変換を使用して、列を複数の列に分割できます。
列を分割する方法
1. 列名を右クリックし、コンテキストメニューから分割を選択します。
2. 分割設定のいずれかを選択し、列を分割するために必要な入力内容を指定します。
利用可能な設定は次のとおりです:
- 開始インデックスと終了インデックス
- 開始位置と長さ
- 区切り文字
- 正規表現(Regex)
- 空白文字
3. 上記の設定のうち、いくつかの必須入力項目について見てみましょう。
開始するインデックスおよび終了インデックス:
開始するインデックス - デリミタが開始する位置のインデックスです。初期設定の開始するインデックスは1です。
終了インデックス - デリミタが終了する位置のインデックスです。
開始するインデックスおよび長さ:
開始するインデックス - デリミタが開始する位置のインデックスです。初期設定の開始するインデックスは1です。
長さ - デリミタの文字数です。
デリミタ:
デリミタ - テキストやパターンをデリミタとして使用して分割します。
開始デリミタ - 開始するデリミタに一致したテキストやパターンから分割します。
終了デリミタ - 終了デリミタの直前まで一致したテキストやパターンで分割します。
正規表現:
正規表現パターン - デリミタを通常の表現で入力します。
大文字小文字を無視 - テキストやパターンを照合する際に大文字・小文字を区別しません。
分割する一致数 - 列として分割する一致数を指定します。最小値は2です。
4. 抽出した値をStore output asオプションを使い、「列」または「list」として保存することも可能です。
5. DataPrepでは、列に対して加えた変更の有効なプレビューが表示されます。
6. この変換は複数の列に適用できます。
オプションを使って列を選択し、適用する列セクションで指定してください。
フィルターの適用方法
この変換とあわせてフィルターを適用したい場合は、フィルター機能を利用できます。
1. フィルタータブをクリックします。
2.

アイコンをクリックし、
フィルターセクションに必要な列を追加します。また、ドラッグ&ドロップでフィルターの並び替えも可能です。
3. 追加した頻度列については、ドロップダウンから次のいずれかの設定を選択できます:
- Actual: このオプションでは、列内の実際の値に基づいて行をフィルタリングできます。詳細はこちらをご覧ください。
- Data 品質: このオプションでは、列内のデータ品質に基づいて行をフィルタリングできます。詳細はこちらをご覧ください。
- Patterns: このオプションでは、選択した列のデータパターンに基づいて行をフィルタリングできます。詳細はこちらをご覧ください。
- Seasonal: このオプションでは、四半期・月・週などの季節的なパラメーターに基づいて行をフィルタリングできます。詳細はこちらをご覧ください。
- Outliers: このオプションでは、選択した列のデータに存在する外れ値に基づいて行をフィルタリングできます。詳細はこちらをご覧ください。
メモ: フィルターの設定内容は、フィルター対象として追加した列のデータ型によって異なります。
4. フィルターセクションに2つ以上のフィルターを追加すると、AND または OR の論理演算子がフィルターの横に表示されます。クリックすることで、論理演算子を AND と OR の間で切り替えられます。
- 論理演算子を使うことで、条件を組み合わせて優先順位ルールを適用できます。最終的な式は条件式ボックスに表示されます。編集をクリックして、論理演算子や括弧を使って優先順位や評価順を指定し、初期設定の式を変更できます。必要な変更を加えた後は保存をクリックしてください。
- 例えば、式 ((1 OR 2) AND (3 OR 4)) の場合、まず (1 OR 2) の条件が実行され、その後 (3 OR 4) の条件が評価されます。最終的に AND 演算子が使用されているため、両方の条件が真の場合にフィルターが適用されます。
5. 各フィルターに対して選択したフィルターオプションに基づき、次のセクションでさらに絞り込んで特定の値を選択できます。
例えば、上記のスクリーンショットでは、Data 品質オプションがフィルターセクションのすべての列フィルターに選択されています。選択内容に基づき、特定の値をフィルターするための追加設定がすべての列(Data 品質)セクションに表示されます。
6. 最後のセクションで、選択した項目を含めるか除外するかを選択できます。
7. 何らかの理由ですべてのフィルターを削除したい場合は、クリアボタンを使用できます。
8. フィルター変換の有効なプレビューが、変更を加えるたびに表示されます。
9. 適用するボタンをクリックして、変換とフィルターを適用します。
関連情報