お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
バケッティング手法を用いて、日付値や個別の日付を分類できます。
-
平日かどうか
-
年内の月
-
年内の週
-
月内の週
-
年内の日
-
月内の日
-
時内の分
-
1日の時間帯
-
独自の日付範囲
平日かどうか
このオプションを使用すると、日付 列に平日・週末を分類するための新規 列を作成できます。
日付 列にWeekday or Notオプションを適用するには:
-
DataPrep Studioページで日付 列を右クリックします。
-
コンテキストメニューから 作成 Buckets を選択します。
-
Transform panelの選択する bucket 設定ドロップダウンから Weekday or not オプションを選択します。
-
WeekdaysまたはWeekendsセクションで曜日を設定できます。
-
新規 列 名前項目に新規 列の名前を入力してください。
-
データグリッドに新規 列のプレビューが表示されます。
-
「適用する」をクリックします。
月ごと
このオプションを使用すると、日付列に新しい列を作成して、1年の各月を分類できます。 月ごとオプションを日付列に適用するには:
-
DataPrep Studioページの日付列を右クリックします。
-
コンテキストメニューからバケット作成オプションを選択します。
-
変換パネルで、選択するバケット設定ドロップダウンから月ごとオプションを選択します。
-
新規列名に新しい列の名前を入力します。
-
バケット作成方法セクションから設定を1つ選択し、必須項目を入力します(詳細は下記参照):
-
カスタム範囲
-
特定の値
-
新しい列のプレビューがデータグリッドに表示されます。
-
適用をクリックします。
カスタム範囲
カスタム範囲を使用して、バケットのラベルを決定するための条件を入力できます。
-
これを行うには、次の比較演算子を使用して条件を入力します。
-
開始する条件の一部として「次の値と等しい(=)」「その他(>)」「その他または次の値と等しい(>=)」を使用します。
-
End条件の一部として「次の値より小さい(<)」または「次の値以下(<=)」を使用します。
-
例えば、日付が上半期に該当するかを分類する開始する条件は「1(1月)以上」となります。
End条件は「6(6月)以下」となります。バケットラベルには「H1, 2018」と入力します。
-
日付が下半期に該当するかを分類する開始する条件は「6より大きい」となります。
End条件は「12以下」となります。バケットラベルには「H2, 2018」と入力します。
-
選択済み列にどの条件にも該当しない値がある場合、「なし」と表示されます。このラベルは一致しない値のラベル項目で編集できます。
-
+ボタンを使用して現在の下に条件をさらに追加するか、-ボタンで現在の条件を削除できます。
-
バケットは新規列に作成され、選択済み日付列の各値の横に、範囲に該当する場合に表示されます。
特定の値
特定の値オプションを利用して、選択済みの数値列から特定の値にラベルを付け、バケットとして分類できます。
この操作を行うには、次の設定を使用して条件を入力します。
-
In
-
Not in
例えば、季節(秋など)に基づいて月をバケット分けしたい場合、「in」条件で該当する月を入力し、バケットラベル欄に「Autumn」と入力して適用するをクリックします。
'not in'条件を選択すると、この条件で指定されていない他の値が1つのラベルの下でバケットされます。
年の週
このオプションを利用すると、日付列の横に新規列を作成し、年の週ごとに分類できます。
日付列に「Week of the year」オプションを適用するには:
-
DataPrep Studioページで日付列を右クリックします。
-
コンテキストメニューから作成 Bucketsオプションを選択します。
-
Transformパネルの選択する bucket 設定ドロップダウンからWeek 件数オプションを選択します。
-
新しい列の名前を新規 列 名前に入力します。
-
作成 Buckets Usingセクションでいずれかの設定を選択し、必須項目を入力します(詳細は下記参照):
-
カスタム range
-
Specific values
-
新しい列のプレビューがデータグリッドに表示されます。
-
適用するをクリックします。
カスタム range
カスタム Rangeオプションを使用して、バケットラベルを決定する条件を入力できます。
-
これを行うには、以下の比較演算子を使って条件を指定します:
-
開始する 条件として「次の値と等しい(=)」、「より大きい(>)」、「以上(>=)」を指定します。
-
End 条件として「より小さい(<)」または「以下(<=)」を指定します。
-
例えば、年の前半に該当する日付を分類するための開始する条件は「1(第1週)以上」となります。
End条件は「26(第26週)以下」となります。バケットラベルとして「H1, 2018」と入力します。
年の後半に該当する日付を分類する開始する条件は「26より大きい」となります。
End条件は「52以下」となります。バケットラベルとして「H2, 2018」と入力します。
-
選択済み列にいずれの条件にも該当しない値がある場合、「なし」と表示されます。このラベルはラベル for unmatched valuesオプションで編集できます。
-
+ ボタンを使用して現在の下に条件をさらに追加したり、- ボタンで現在の条件を削除できます。
特定の値
Specific Valuesオプションを使用して、選択済み数値列から特定の値をバケットとしてラベル付けできます。
この操作を行うには、以下の条件を指定してください。
-
In
-
Not in
-
例えば、特定の週(祝日など)に食料品店で高い営業ボリュームがある場合、Specific Valuesオプションを選択し、「In」条件を選び、週番号(例:45、46、47)を入力します。バケットラベルには「高い営業week」と入力し、「適用する」をクリックします。
-
同じ週を「Not in」条件に入力すると、それ以外の期間は「低い営業week」と名付けることができます。
-
条件に一致しないものには、初期値として「なし」が割り当てられます。

月の週
このオプションを使用すると、日付列の隣に新しい列を作成し、月内の週を分類できます。
日付列に「月の週」オプションを適用するには:
-
DataPrep Studioページで日付列を右クリックします。
-
コンテキストメニューからバケットの作成オプションを選択します。
-
変換パネルで、月内の週オプションをバケット設定の選択ドロップダウンから選択します。
-
新規列名欄に新しい列の名前を入力してください。
-
作成バケットの使用セクションで設定のいずれかを選択し、必須項目を入力します(詳細な説明は下記参照):
-
カスタム範囲
-
特定の値
-
新しい列のプレビューがデータグリッドに表示されます。
-
適用をクリックします。
カスタム範囲オプションを使って、バケットラベルを決定する条件を入力できます。
-
この操作を行うには、次の比較演算子を使用して条件を入力します。
-
「次の値と等しい(=)」、「その他(>)」、または「その他または次の値と等しい(>=)」を開始する条件として設定します。
-
「次の値より小さい(<)」または「次の値以下(<=)」をEnd条件として設定します。
-
例として、毎月の最初の2週間に商品に対する営業の音量が高い場合、開始するおよびend条件「>= 1 かつ <= 2」を「高い営業」、「> 2 かつ <= 4」を「低い営業」として分類できます。
-
選択済み列の値がいずれの条件にも該当しない場合、「なし」としてマークされます。このラベルはunmatched valuesオプションで編集できます。
-
+ ボタンを使用して現在の条件の下にさらに条件を追加したり、- ボタンで現在の条件を削除したりできます。
特定の値
Specific Valuesオプションを使用して、選択した数値列の特定の値にラベルを付け、バケットとして分類できます。
-
例えば、毎月の特定の週に自社で営業活動が多い場合、Specific Valuesオプションを選択し、週番号を入力して「ピーク営業週」とラベル付けできます。
-
条件に一致しないエントリーには、初期値「なし」が設定されます。
年間日数
このオプションを利用すると、日付列の隣に新しい列を作成し、1年の日を分類できます。
日付列に「年間日数」オプションを適用する手順:
- DataPrep Studioページで日付列を右クリックします。
- コンテキストメニューからバケット作成オプションを選択します。
- Transformパネル内のバケット設定の選択ドロップダウンから年間日数を選択します。
- 新規列名欄に新しい列の名前を入力します。
- 作成方法を選択セクションでいずれかの設定を選択し、必要事項を入力します(詳細は下記参照):
- カスタム範囲
- Specific values
- 新しい列のプレビューがデータグリッドに表示されます。
- 適用をクリックします。
カスタム範囲
カスタム範囲オプションを使うことで、バケットラベルを決定する条件を入力できます。
- この操作を行う場合、以下の比較演算子を用いて条件を入力します:
- 開始条件には「次の値と等しい(=)」「より大きい(>)」または「以上(>=)」を使用
- 終了条件には「より小さい(<)」または「以下(<=)」を使用
- 例えば、年末の繁忙期に食料品店で営業活動が多い場合、カスタム範囲オプションを選択し、開始条件と終了条件を「>= 300」と「<= 356」と入力して範囲を指定します。

- 選択した列にいずれの条件にも一致しない値がある場合、「なし」と表示されます。「一致しない値のラベル」オプションでこのラベルを編集できます。
- +ボタンを使用して現在の条件の下にさらに条件を追加したり、-ボタンで現在の条件を削除したりできます。
特定の値
- 「特定の値」オプションを使用して、選択した数値列の特定の値にラベルを付け、バケット分けできます。
- 例えば、法人で毎月最初の2日間に売上が多い場合、「特定の値」オプションを選択し、日付番号として1、2、32、33、60、61、…334、335のように入力できます。残りの日は売上が少ない場合は、「Not in」条件を選択して、売上が多くない日付にラベルを付けられます。条件に合致しないものには、初期値として「なし」と表示されます。

月の日付
このオプションを使用すると、日付列に新しい列を作成し、月の日を分類できます。
日付列に月の日オプションを適用するには:
- DataPrep Studioページで日付列を右クリックします。
- コンテキストメニューからバケットの作成オプションを選択します。
- Transformパネルのバケットオプションドロップダウンから月の日オプションを選択します。
- 新規列名項目に新しい列の名前を入力してください。
- 「バケットの作成」セクションでいずれかの設定を選択し、必須項目を入力します(詳細は下記をご参照ください):
- カスタム範囲
- 特定の値
6. 適用をクリックします。
カスタム範囲
カスタム範囲オプションを使って、バケットのラベルを決定する条件を入力できます。
- これを行うには、以下の比較演算子を使って条件を入力します:
- 開始条件として次の値と等しい(=)、より大きい(>)、または以上(>=)
- 終了条件として次の値より小さい(<)、または以下(<=)
- 例えば、月の前半と後半で異なるチーム予定を設定する場合、比較演算子を使って開始条件と終了条件を入力できます:
- 日が >= 1 かつ <=15 の場合、ラベルは「Technical discussion」
- 日が >15 かつ <=31 の場合、ラベルは「ステータス更新」
- 選択した列の値がいずれの条件にも当てはまらない場合、「なし」とマークされます。ラベル for unmatched values オプションでこのラベルを編集できます。
- + ボタンを使用して現在の下にさらに条件を追加したり、- ボタンで現在の条件を削除できます。

特定の値
Specific Values オプションを使うことで、選択した数値列から特定の値をバケットとしてラベル付けできます。
例えば、毎月6日と20日にチーム予定を設定したい場合、6と20を入力し、それぞれ「プロジェクト management meet」と「ステータス meet」とラベル付けできます。
条件に合致しない日付には初期値「なし」が割り当てられます。
時の分
このオプションを使用すると、日付-時間列に対して「時間帯」で分類された新しい列を作成できます。
時間帯オプションを日付列に適用するには、以下の手順に従ってください。
- DataPrep Studioページで日付-時間列を右クリックします。
- コンテキストメニューから作成 Bucketsオプションを選択します。
- Transform panelのバケッティング方法ドロップダウンからMinute of the hourオプションを選択します。
- 新規 列 名前欄に新しい列の名前を入力してください。
- 作成 buckets の設定からいずれかを選択し、必須項目を入力します(詳細は下記参照):
- カスタム範囲
- 特定の値
- 新しい列のプレビューがデータグリッドに表示されます。
- 「適用する」をクリックします。
カスタム範囲
カスタム範囲オプションを使うと、バケットのラベルを判定するための条件を入力できます。
この操作を行うには、以下の比較演算子を使って条件を入力します。
- 開始条件として「=(等しい)」、「>(より大きい)」、「≧(以上)」を使用
- 終了条件として「<(より小さい)」、「≦(以下)」を使用
例:フライトチェックインの行動分析
「チェックイン時間」列があり、各時間内で乗客がどれだけ早くまたは遅くチェックインしたかでグループ化したい場合。
開始条件 |
終了条件 |
ラベル |
>= 0 |
< 15 |
早めのチェックイン |
>= 15 |
< 30 |
中間到着 |
>= 30 |
< 45 |
ぎりぎりチェックイン |
>= 45 |
< 59 |
直前チェックイン |
この分類により、空港運営では乗客の流れを予測し、待機列を管理し、スタッフの配置を効果的に調整できます。
選択した列の値がいずれの条件にも当てはまらない場合は「なし」と表示されます。一致しない値のラベルオプションでこのラベルを編集できます。
+ ボタンを使うと現在の条件の下にさらに条件を追加できます。また - ボタンで現在の条件を削除できます。
特定の値
「Specific Values」オプションを使用して、選択した数値列の特定の値にラベルを付け、バケットとして分類できます。
例えば、特定の分や時間帯に、航空会社がクルーのチェックイン専用カウンターを開設する場合があります。データ内でこれらの特定の分にタグを付けることで、レポーティングが容易になります。
条件に一致しない分には、初期値として「なし」が設定されます。 このラベルは一致しない値のラベルオプションで編集できます。

時間帯
このオプションを利用すると、日付・時間列の横に新しい列を作成し、一日の時間帯ごとに分類できます。
日付列に時間帯オプションを適用するには、以下の手順に従います。
- 日付・時間列をDataPrep Studioページで右クリックします。
- コンテキストメニューからバケット作成オプションを選択します。
- 選択するバケット方式ドロップダウンの中から時間帯オプションを選択します(Transform panel内)。
- 新規列名項目に新しい列の名前を入力します。
- バケットの作成方法セクションでいずれかの設定を選択し、必須項目を入力します(詳細は下記説明を参照)。
- カスタム範囲
- 特定の値
- データグリッドに新しい列のプレビューが表示されます。
- 適用をクリックします。
カスタム範囲
「カスタム範囲」オプションを使うと、バケットラベルを決定するための条件を入力できます。
- この操作を行うには、下記の比較演算子を用いて条件を入力します。
- 開始条件として、次の値と等しい(=)、より大きい(>)、または以上(>=)を使用します。
- 終了条件として、より小さい(<)、または以下(<=)を使用します。
- 例えば、チームのシフト時間を指定する場合、開始・終了条件を比較演算子で入力できます。例:>= 7AM かつ < 3PM を「Morning shift」、>=3PM かつ <11PM を「Noon shift」、>=12AM かつ <7AM を「Night shift」とします。

-
選択した列にいずれの条件にも当てはまらない値がある場合、「なし」としてマークされます。このラベルは一致しない値のラベルオプションで編集可能です。
-
「+」ボタンで現在の条件の下にさらに条件を追加したり、「-」ボタンで現在の条件を削除できます。
独自の日付範囲
このオプションを使うことで、日付列の横に新しい列を作成し、日付の範囲ごとに分類・ラベル付けできます。
「独自の日付範囲」オプションを日付列に適用する手順は以下の通りです。
-
DataPrep Studioページで日付列を右クリックします。
-
バケット作成オプションをコンテキストメニューから選択します。
-
独自の日付範囲オプションをバケット方法を選択ドロップダウンから、Transformパネルで選択します。
-
新規列名項目に新しい列の名前を入力します。
-
日付ピッカーを使用して「From 日付」と「To 日付」を選択し、バケットラベルを入力します。
-
例えば、ホリデーシーズン中の日付範囲にラベルを付けたい場合は、開始条件を12月6日、終了条件を12月10日とし、「Holidays」とラベル付けできます。
-
選択した列にどの条件にも該当しない値がある場合、「なし」と表示されます。このラベルは 一致しない値のラベルオプションで編集できます。
-
新しい列のプレビューがデータグリッドに表示されます。
-
適用をクリックします。

フィルターを適用する方法
この変換とあわせてフィルターを適用したい場合は、フィルター機能を利用できます。
1. フィルタータブをクリックします。
2.

アイコンをクリックし、
フィルターセクションに必要なカラムを追加します。また、ドラッグ&ドロップでフィルターの並び替えも可能です。
3. 追加された頻度列については、ドロップダウンから以下の設定のいずれかを選択できます。
- Actual: このオプションでは、列の実際の値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Data 品質: このオプションでは、列内のデータ品質に基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Patterns: このオプションでは、選択した列のデータパターンに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Seasonal: このオプションでは、四半期、月、週などの季節的パラメーターに基づいて行をフィルターできます。詳細はこちらをご覧ください。
- Outliers: このオプションでは、選択した列のデータ内に存在する外れ値に基づいて行をフィルターできます。詳細はこちらをご覧ください。
メモ: フィルター設定は、フィルターに追加した列のデータ型に基づいて表示されます。
4. フィルターセクションに2つ以上のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。クリックすることで、ANDとORの論理演算子を切り替えることができます。
- 論理演算子を使って条件を組み合わせ、優先順位のルールを適用できます。最終的な式はCriteria expressionボックスに表示されます。編集をクリックして、論理演算子や括弧を用いて優先順位や条件を評価する順序を指定し、初期設定の式を変更できます。必要な変更を行った後、保存をクリックしてください。
- 例: ((1 AND 2) OR (3 AND 4)) という式では、まず(1 AND 2)の条件が実行され、次に(3 AND 4)の条件が実行されます。3番目に、OR演算子が使用されているため、どちらかまたは両方の条件が真であればフィルターが適用されます。
5. さらに、各フィルターの選択したフィルターオプションに基づき、特定の値を選択して絞り込むことができます。
例えば、上記のスクリーンショットでは、Data 品質 オプションがフィルター セクションのすべての列フィルターで選択されています。選択内容に基づき、さらに特定の値をフィルターするための設定がすべての列(Data 品質)セクションに表示されます。
6. 最後のセクションで、選択済みの商品を含めるか除外するかを選択できます。
7. 何らかの理由でフィルターをすべて削除したい場合は、クリア ボタンを使用できます。
8. フィルター変換の有効なプレビューが、変更時に表示されます。
9. 変換およびフィルターを適用するには、適用する ボタンをクリックしてください。
データを並べ替える方法
並べ替えるタブでは、任意の列を基準に昇順または降順でデータを並べ替えることができます。並べ替え列のドロップダウンから列を選択し、並べ替え順序を指定してください。
この機能は変換と組み合わせてのみ使用でき、単独の機能としては利用できません。ただし、データだけを並べ替えたい場合は
並べ替える変換を利用できます。
関連情報