列内の特定の値を件数する方法
1. 列名を右クリックし、コンテキストメニューから件数を選択します。
2. トランスフォーム画面の新規 列 名前項目で、新しい列名を入力します。
3. 件数 設定ドロップダウンから設定を選択します。これに基づき、列の値が件数対象として選択されます。利用可能な設定は以下の通りです:
-
テキストまたはパターンの一致
-
Regex(正規表現)
4. テキストまたはパターンの一致:このオプションでは、該当のセル値の一部または全体に一致するテキストやパターンを、下記項目に入力して件数を行います。
- 一致させるテキストまたはパターン:指定したテキストやパターンの出現回数を件数します。
- 開始テキストまたはパターン:指定したテキストやパターンで始まる値を件数します。
- 終了テキストまたはパターン:指定したテキストやパターンで終わる値を件数します。
メモ: DataPrepでのパターンマッチングに慣れていない場合は、
こちらをご覧ください。
5. Regex(正規表現):このオプションでは、件数したい値の正規表現を入力します。
6. 大文字と小文字を無視のチェックボックスをオンにすると、テキストやパターンの一致時に大文字・小文字を区別せずに件数できます。
フィルターを適用する方法
この変換とあわせてフィルターを適用したい場合は、フィルター機能をご利用いただけます。
1. フィルタータブをクリックします。
2.

アイコンをクリックし、
フィルターセクションに必須列を追加します。ドラッグ&ドロップでフィルターの並び替えも可能です。
3. 追加された頻度列については、ドロップダウンから以下のいずれかの設定を選択できます。
- Actual: このオプションでは、列の実際の値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Data 品質: このオプションでは、列内データの品質に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Patterns: このオプションでは、選択した列のデータパターンに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Seasonal: このオプションでは、四半期・月・週などのシーズナルパラメーターに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Outliers: このオプションでは、選択した列に存在する外れ値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
メモ: フィルター設定は、フィルターに追加した列のデータ型に応じて表示されます。
4. フィルターセクションに複数のフィルターを追加すると、フィルターの横に論理演算子ANDまたはORが表示されます。クリックすることで、論理演算子をANDとORの間で切り替えられます。
- 論理演算子を使用して条件を組み合わせ、適用するロジックを指定して優先順位を決定できます。最終的な式はCriteria expressionボックスに表示されます。編集をクリックして、論理演算子や括弧を使い、優先順位や評価順序を指定して初期設定の式を編集できます。必須の変更を行った後は保存をクリックしてください。
- 例えば、式 ((1 OR 2) AND (3 OR 4)) では、まず条件 (1 OR 2) が実行され、次に条件 (3 OR 4) が実行されます。3番目に、AND演算子が使用されているため、両方の条件が真の場合にフィルターが適用されます。
5. 次のセクションでは、各フィルターの選択済みオプションに基づいて、さらに特定の値を選択して絞り込むことができます。
例えば、上記のスクリーンショットでは、Data 品質オプションがフィルターセクションのすべてのカラムフィルターに選択されています。選択内容に基づき、さらにフィルターするための設定がすべてのカラム (Data 品質)セクションに表示されます。
6. 最後のセクションで、選択済みの項目を含めるか除外するかを選択できます。
7. 何らかの理由で全てのフィルターを削除したい場合は、クリアボタンを使用できます。
8. フィルター変換の有効なプレビューが、変更を行うと表示されます。
9. 適用ボタンをクリックして、フィルターとともに変換を適用します。
データを並べ替えるには
並べ替えタブでは、任意の列を基準にデータを昇順または降順で並べ替えることができます。並べ替え列ドロップダウンから列を選択し、並べ替えの順序を指定できます。
この機能は変換とあわせてのみ利用でき、単独の機能としては使用できません。ただし、データのみを並べ替えたい場合は、
並べ替え変換を使用できます。