スプリット

スプリット

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




DataPrepでは、指定した入力内容に基づき列を分割できます。選択した分割オプションに応じて、区切り文字を使用して1つの列を複数の列に分割できます。
​​​​
列を複数の列に分割するには、 分割トランスフォームを使用します。

列を分割する方法

1. 列名を右クリックし、コンテキストメニューから分割を選択します。

2. 分割設定のいずれかを選択し、列を分割する際に必要な入力内容を指定します。

利用可能な設定は次のとおりです:
  1. 開始インデックスと終了インデックス
  2. 開始インデックスと長さ
  3. 区切り文字
  4. 正規表現(Regex)
  5. 空白文字
3. 上記の設定の中から、いくつかの設定に必要な入力内容を確認しましょう。

開始インデックスと終了インデックス:
開始インデックス - 区切り文字の開始位置を指定します。初期設定の開始インデックスは1です。
終了インデックス - 区切り文字の終了位置を指定します。

開始インデックスと長さ:
開始インデックス - 区切り文字の開始位置を指定します。初期設定の開始インデックスは1です。
長さ - 区切り文字の文字数を指定します。

区切り文字:
区切り文字 - 指定したテキストやパターンで分割します。
開始区切り文字 - 開始区切り文字に合致するテキストやパターンから分割を開始します。
終了区切り文字 - 終了区切り文字の直前までのテキストやパターンを使って分割します。

正規表現(Regex):
正規表現パターン - 区切り文字として正規表現を入力します。



大文字・小文字を区別しない - テキストやパターンの一致判定時に大文字・小文字の区別をオフにします。
一致の番号で分割 - 一致した番号を列として分割する数を指定します。最小値は2です。

4. 出力の保存方法 オプションを使用して、抽出した値を「列」または「リスト」として保存することもできます。
 
5. DataPrepは、列に加えた変更の有効なプレビューを表示します。

6. この変換は複数の列に適用可能です。 オプションを使用して、適用する列 セクションから列を選択してください。  

フィルターを適用するには

この変換とあわせてフィルターを適用したい場合は、フィルター機能を利用できます。

1. フィルター タブをクリックします。

2. アイコンをクリックし、フィルター セクションに必要な列を追加します。フィルターはドラッグ&ドロップで並べ替えも可能です。



3. 追加した頻度列については、ドロップダウンから次のいずれかの設定を選択できます:
  1. Actual: このオプションでは、列内の実際の値に基づいて行をフィルターできます。こちらをクリックして詳細をご覧ください。
  2. Data 品質: このオプションでは、列内データの品質に基づいて行をフィルターできます。こちらをクリックして詳細をご覧ください。
  3. Patterns: このオプションでは、選択した列内のデータパターンに基づいて行をフィルターできます。こちらをクリックして詳細をご覧ください。
  4. Seasonal: このオプションでは、四半期・月・週などの季節パラメーターに基づいて行をフィルターできます。こちらをクリックして詳細をご覧ください。
  5. Outliers: このオプションでは、選択した列のデータに存在する外れ値に基づいて行をフィルターできます。こちらをクリックして詳細をご覧ください。
メモ: フィルター設定は、フィルターに追加された列のデータ型に基づいて表示されます。

4. フィルターセクションに複数のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。論理演算子のANDとORを切り替えるにはクリックします。
  1. 論理演算子を使用して条件を組み合わせ、優先順位のルールを適用できます。最終的な式は条件式ボックスに表示されます。論理演算子や括弧を使い、優先順位や評価順を指定して初期設定の式を変更したい場合は編集をクリックしてください。必要な変更を行った後は保存をクリックします。
  1. 例えば、式 ((1 OR 2) AND (3 OR 4)) では、まず条件 (1 OR 2) が実行され、その後条件 (3 OR 4) が実行されます。最終的にAND演算子が使われているため、両方の条件が真の場合にフィルターが適用されます。
5. さらに、各フィルターで選択済みのフィルターオプションに基づき、特定の値を選択できます。



例えば、上記のスクリーンショットでは、Data品質オプションがフィルターセクションの「すべての列」フィルターに選択されています。選択内容に応じて、特定の値をフィルターするための追加設定がすべての列(Data品質)セクションに表示されます。

6. 最後のセクションで、選択済みの商品を含めるか除外するかを選択できます。

7. 何らかの理由で全てのフィルターを削除したい場合は、クリアボタンを使用できます。

8. フィルター変換の有効なプレビューは、変更を加えると表示されます。

9. 適用するボタンをクリックすると、変換とともにフィルターが適用されます。

データを並べ替えるには

並べ替えタブでは、任意の列を基準に昇順または降順でデータを並べ替えることができます。並べ替え列ドロップダウンから列を選択し、並べ替える順序を選択してください。

この機能は変換とあわせてのみ利用でき、単独の機能としては使用できません。ただし、データだけを並べ替えたい場合は並べ替え変換を使用できます。




関連情報