列内の特定の値を件数する方法
1. 列名を右クリックし、コンテキストメニューから件数を選択します。
2. 操作ペインの新規列名項目に、新しい列名を入力します。
3. ドロップダウンの件数設定から設定を選択します。これに基づき、件数対象となる列の値が選択されます。利用可能な設定は以下の通りです:
-
テキストまたはパターン一致
-
Regex
4. テキストまたはパターン一致:このオプションでは、セル値の一部または全体に一致するテキストやパターンを以下の項目に入力し、件数対象とします。
- 一致するテキストまたはパターン:指定したテキストやパターンの出現回数を件数します。
- 開始テキストまたはパターン:指定したテキストやパターンから始まる値を件数します。
- 終了テキストまたはパターン:指定したテキストやパターンの直前で終わる値を件数します。
メモ: DataPrepでのパターンマッチングに慣れていない場合は、
こちらをご参照ください。
5. Regex(正規表現):このオプションでは、件数したい値の正規表現を入力します。
6. テキストやパターンの一致時に大文字と小文字を区別しない場合は、大文字と小文字を無視チェックボックスをオンにできます。
フィルターの適用方法
この変換と一緒にフィルターを適用したい場合は、フィルター機能を利用できます。
1. フィルタータブをクリックします。
2.

アイコンをクリックし、
フィルターセクションに必要な列を追加します。ドラッグ&ドロップでフィルターの並べ替えも可能です。
3. 追加した頻度列に対して、ドロップダウンから以下のいずれかの設定を選択できます。
- Actual: このオプションでは、列内の実際の値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Data 品質: このオプションでは、列内のデータ品質に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Patterns: このオプションでは、選択した列内のデータパターンに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Seasonal: このオプションでは、四半期・月・週などの季節的なパラメーターに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Outliers: このオプションでは、選択した列のデータ内に存在する外れ値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
メモ: フィルターの設定は、フィルターに追加した列のデータ型に応じて表示されます。
4. フィルターセクションに2つ以上のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。論理演算子をクリックしてANDとORを切り替えることができます。
- 論理演算子を使って条件を組み合わせ、優先順位のルールを適用できます。最終的な式は条件式ボックスに表示されます。編集をクリックして、論理演算子や括弧を用いて優先順位や評価順を指定することができます。必要な変更後に保存をクリックしてください。
- 例: 式((1 OR 2) AND (3 OR 4))の場合、(1 OR 2)の条件が先に実行され、その後(3 OR 4)の条件が続きます。最終的にAND演算子が使われているため、両方の条件が真のときにフィルターが適用されます。
5. 次のセクションでは、フィルターオプションで選択した各フィルターに基づき、さらに特定の値を選択して絞り込むことができます。
例として、上記のスクリーンショットでは、Data 品質オプションがフィルターセクションのすべてのカラムフィルターに対して選択されています。選択内容に基づき、さらに特定の値でフィルター設定を行うためのオプションがすべてのカラム(Data 品質)セクションに表示されます。
6. 最後のセクションで、選択されたアイテムを含めるか除外するかを選択できます。
7. 何らかの理由で全てのフィルターを削除したい場合は、クリアボタンを使用できます。
8. フィルター変換の有効なプレビューが、変更を加えるごとに表示されます。
9. 適用するボタンをクリックすると、フィルターと共に変換が適用されます。