バケットを作成 - テキスト
バケットを作成 - テキスト
お知らせ:
当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版
を参照してください。
条件を指定してテキスト列にバケッティングを実施できます。
たとえば、特定のチームに人を割り当てる必要がある場合を考えます。
この場合、値をバケット(ここではチーム名)に追加するロジックを実装できます。
名前
チーム
Sena, Stephen, Alfy
営業
Weber, Tandy, Hallsy
マーケティング
Jared
エンジニアリング
Jerrie, Karim
サポート
このデータでバケッティング処理を開始するには、以下のような条件を作成できます:
値が(
Sena, Stephen, Alfy
)に含まれている場合、バケット「営業」に追加
値が(
Weber, Tandy, Hallsy
)に含まれている場合、バケット「マーケティング」に追加
値が(
Jerrie, Karim
)に含まれている場合、バケット「サポート」に追加
値が(
Jared
)に含まれている場合、バケット「エンジニアリング」に追加
「in」条件以外にも、次の条件を使用できます:
not in(含まれていない)
contains(含む)
doesn't contain(含まない)
begins with(で始まる)
doesn't begin with(で始まらない)
ends with(で終わる)
doesn't end with(で終わらない)
regex(正規表現)
テキスト列に
バケッティング
を適用するには:
Studio
ページで対象のテキスト列を右クリックします。
コンテキストメニューから
バケット作成
オプションを選択します。
Studio
パネルで新しい列の名前を
ベース列名
に入力します。
各バケットのラベルを
バケットラベル
欄に入力します。
選択した列の値がどの条件にも該当しない場合は、
マッチしない値のラベル
オプションで「NA」などのラベルが割り当てられます。
必要に応じて条件を入力し、
保存
をクリックします(上記のサンプルユースケースと例もご参照ください)。
結果の列のプレビューが、選択した列の横にデータグリッド上で表示されます。
適用
をクリックします。
フィルターを適用する方法
この変換とあわせてフィルターも適用したい場合は、フィルター機能を使用できます。
1.
フィルター
タブをクリックします。
2.
アイコンをクリックし、
フィルター
セクションで必要なカラムを追加します。ドラッグ&ドロップでフィルターの並び替えも可能です。
3. 頻度列が追加された場合、ドロップダウンから以下のいずれかの設定を選択できます:
Actual: このオプションでは、列の実際の値に基づいて行をフィルターできます。詳しくは
こちら
をご覧ください。
Data 品質: このオプションでは、列内のデータ品質に基づいて行をフィルターできます。詳しくは
こちら
をご覧ください。
Patterns: このオプションでは、選択した列のデータパターンに基づいて行をフィルターできます。詳しくは
こちら
をご覧ください。
Outliers: このオプションでは、選択した列のデータに存在する外れ値に基づいて行をフィルターできます。詳しくは
こちら
をご覧ください。
メモ: フィルターの設定は、フィルターに追加した列のデータ型によって表示されます。
4.
フィルター
セクションに2つ以上のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。クリックすることで、ANDとORの論理演算子を切り替えられます。
論理演算子を使用して条件を組み合わせ、優先順位のルールを設定できます。最終的な式は
条件式
ボックスに表示されます。
編集
をクリックすると、論理演算子や括弧を使って優先順位や条件評価の順序を指定し、初期設定の式を変更できます。必要な変更を加えたら
保存
をクリックしてください。
例として、式((1 OR 2) AND (3 OR 4))の場合、(1 OR 2)の条件が先に実行され、その後(3 OR 4)の条件が実行されます。最後にAND演算子が使用されているため、両方の条件が真の場合にフィルターが適用されます。
5. 各フィルターごとに選択したフィルターオプションに基づき、次のセクションで特定の値をさらに絞り込んで選択することができます。
例えば、上記のスクリーンショットでは、
Data 品質
オプションが
フィルター
セクション内のすべての列フィルターに選択されています。この選択に基づき、さらに特定の値をフィルターする設定が
すべての列(Data 品質)
セクションに表示されます。
6. 最後のセクションで、選択した項目を含めるか除外するかを選択できます。
7. 何らかの理由で全てのフィルターを削除したい場合は、
クリア
ボタンを使用できます。
8. フィルター変換の有効なプレビューが、変更すると表示されます。
9.
適用する
ボタンをクリックすると、フィルターを含む変換が適用されます。
関連項目
日付カラム用のbucketsを作成する方法
番号カラム用のbucketsを作成する方法
フィルターtransformについて参照