検索と置換

検索と置換

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




置き換える変換を使用して、列内の値を検索および置き換えできます。さまざまな設定を利用して、一致する値を検索し、任意の入力値に置き換えることが可能です。

列データを検索して置き換える方法

1. 列名を右クリックし、コンテキストメニューから置き換えるを選択します。

2. DataPrepでは、列データから値を見つけやすくするための詳細なマッチング設定が複数用意されています。置き換える設定で利用できる設定は以下の通りです。
  1. 開始インデックスと終了インデックス
  2. 開始インデックスと長さ
  3. テキストまたはパターンの一致
  4. 正規表現(Regex)
  5. 先頭の「n」文字
  6. 末尾の「n」文字
3. 選択したオプションに応じて、検索する値と置き換える値を入力してください。

一部の設定で必要となる入力内容を見てみましょう。

開始インデックスと終了インデックス: 
開始インデックス - 指定した開始インデックスから値を置き換えます。デフォルトの開始インデックスは1です。
終了インデックス - 指定したインデックスまでの値が置き換えられます。

開始インデックスと長さ: 
開始インデックス - 指定した開始インデックスから値を置き換えます。デフォルトの開始インデックスは1です。
長さ - 開始インデックスから指定した長さ分の値を置き換えます。

テキストまたはパターンの一致: 
照合するテキストまたはパターン - 指定したテキストまたはパターンと一致する値を置き換えます。
開始テキストまたはパターン - 指定したテキストまたはパターンから始まる値を置き換えます。
終了テキストまたはパターン - 指定したテキストまたはパターンの直前で終わる値を置き換えます。
Notes メモ: DataPrepでのパターンマッチングに不慣れな方は、こちらをご参照ください。

正規表現(Regex):
正規表現パターン - 置き換えたい値の正規表現を入力します。

先頭の「n」文字: 
置き換える文字数 - 値の先頭から置き換える文字数を指定します。

末尾の「n」文字:
置き換える文字数 - 値の末尾から置き換える文字数を指定します。

置き換える値:
一致したテキストやパターンを、置き換えたい値に変更します。

4. 必要に応じて大文字と小文字を無視すべて置き換えるを選択することもできます。



大文字・小文字を無視: 値を検索する際、テキストやパターンの大文字・小文字を区別しません。
置き換える すべて: 入力された内容に一致するすべての箇所を置き換えます。チェックを外すと、初期設定では最初に一致した箇所のみが置き換えられます。

5. DataPrepは、列に対して行った変更の有効なプレビューを表示します。

6. この変換は複数の列に同時に適用できます。アイコンをクリックし、Columns to 適用するセクションで列を選択します。

フィルターの適用方法

この変換とあわせてフィルターも適用したい場合は、フィルター機能を利用できます。

1. フィルタータブをクリックします。

2. アイコンをクリックし、必須の列をフィルターセクションに追加します。フィルターはドラッグ&ドロップで並び替えることも可能です。



3. 頻度列が追加された場合、以下のいずれかの設定をドロップダウンから選択できます:
  1. Actual: 列の実際の値に基づいて行をフィルタリングします。詳細はこちらをご覧ください。
  2. Data 品質: 列内のデータ品質に基づいて行をフィルタリングします。詳細はこちらをご覧ください。
  3. Patterns: 選択した列のデータパターンに基づいて行をフィルタリングします。詳細はこちらをご覧ください。
  4. Seasonal: 四半期、月、週などの季節パラメーターに基づいて行をフィルタリングします。詳細はこちらをご覧ください。
  5. Outliers: 選択した列のデータ内に存在する外れ値に基づいて行をフィルタリングします。詳細はこちらをご覧ください。
メモ: フィルターの設定は、フィルター対象の列のデータ型に応じて表示されます。

4. フィルターセクションに複数のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。論理演算子はクリックでANDとORの間で切り替え可能です。
  1. 論理演算子を使って条件を組み合わせ、優先順位のルールを決定するロジックを適用できます。最終的な式は条件式ボックスに表示されます。編集をクリックすると、論理演算子やかっこを用いて優先順位や評価される順序を指定し、初期設定の式を変更できます。必要な変更を加えた後は保存をクリックしてください。
  1. 例えば、式 ((1 OR 2) AND (3 OR 4)) では、まず (1 OR 2) の条件が実行され、次に (3 OR 4) の条件が実行されます。最後にAND演算子が使用されているため、両方の条件が真の場合にフィルターが適用されます。
5. さらに、各フィルターで選択したフィルターオプションに基づき、特定の値を選択して詳細に絞り込むことができます。



例えば、上記のスクリーンショットでは、Data 品質オプションがフィルターセクションのすべてのカラムフィルターに選択されています。選択内容に基づき、さらにフィルターするための特定の値の設定がすべてのカラム(Data 品質)セクションに表示されます。

6. 最後のセクションでは、選択したアイテムを含めるか除外するかを選択できます。

7. 何らかの理由ですべてのフィルターを削除したい場合は、クリアボタンを使用できます。

8. フィルター変換の有効なプレビューが、変更を加えるたびに表示されます。

9. 適用するボタンをクリックして、フィルターとともに変換を適用してください。

データを並べ替えるには

並べ替えタブでは、任意の列を基準にデータを昇順または降順で並べ替えることができます。並べ替え列ドロップダウンで列を選択し、並び替えの順序を選択してください。

この機能は、変換時のみ使用でき、単独の機能としては利用できません。ただし、データの並べ替えのみを行いたい場合は、並べ替え変換を使用できます。