検索と置換

検索と置換

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




置き換える変換を利用して列内の値を検索・置換できます。さまざまな利用可能な設定を使って、置換したい値を特定し、任意の値に差し替えることが可能です。

列データの検索と置換方法

1. 列名を右クリックし、コンテキストメニューから置き換えるを選択します。

2. DataPrepでは、列データ内の値を効率的に検索できる複数の詳細なマッチング設定を用意しています。置き換える設定で利用できるオプションは以下の通りです。
  1. 開始インデックスと終了インデックス
  2. 開始インデックスと長さ
  3. テキストまたはパターンでの一致
  4. 正規表現(Regex)
  5. 先頭から「n」文字
  6. 末尾から「n」文字
3. 選択したオプションに応じて、検索する値と、置換後の値を入力してください。

上記設定の一部で必要となる入力項目について説明します。

開始インデックスと終了インデックス 
開始インデックス - 指定した開始インデックスから値を置き換えます。初期値は1です。
終了インデックス - 指定したインデックスまで値を置換します。

開始インデックスと長さ 
開始インデックス - 指定した開始インデックスから値を置き換えます。初期値は1です。
長さ - 開始インデックスから指定した長さ分の値を置き換えます。

テキストまたはパターンでの一致: 
照合するテキストまたはパターン - 指定したテキストやパターンに一致する値を置き換えます。
開始テキストまたはパターン - 指定したテキストまたはパターンから始まる値を置き換えます。
終了テキストまたはパターン - 指定したテキストまたはパターンの直前で終わる値を置き換えます。
Notes メモ:DataPrepでのパターンマッチングについて詳しく知りたい場合は、こちらをご覧ください。

正規表現(Regex):
正規表現パターン - 置き換えたい値の正規表現を入力します。

先頭から「n」文字: 
置き換える文字数 - 値の先頭から置き換える文字数を指定します。

末尾から「n」文字:
置き換える文字数 - 値の末尾から置き換える文字数を指定します。

置き換え後の値:
照合したテキストやパターンをどの値に置き換えるかを指定します。

4. 必要に応じて大文字と小文字を無視またはすべて置き換えるを選択することもできます。



Notes
大文字と小文字を区別しない : テキストやパターンが値と一致する際に、大文字と小文字を区別しません。
すべて置き換える : 入力された内容に一致するすべての箇所を置き換えます。チェックを外した場合、初期設定の変換では最初に一致した箇所のみ置き換えます。

5. DataPrepは、列に対して行った変更の有効なプレビューを表示します。

6. この変換を複数の列に同時に適用できます。アイコンを使用して、適用する列セクションから列を選択してください。

フィルターの適用方法

この変換とあわせてフィルターを利用したい場合は、フィルター機能を使用できます。

1. フィルタータブをクリックします。

2. アイコンをクリックし、フィルターセクションで必要な列を追加します。フィルターはドラッグ&ドロップで並べ替えることも可能です。


3. 頻度列が追加された場合、ドロップダウンから次のいずれかの設定を選択できます:
  1. Actual:このオプションでは、列の実際の値に基づいて行をフィルタリングできます。詳しくはこちらをご覧ください。
  2. Data 品質:このオプションでは、列内データの品質に基づいて行をフィルタリングできます。詳しくはこちらをご覧ください。
  3. Patterns:このオプションでは、選択した列のデータパターンに基づいて行をフィルタリングできます。詳しくはこちらをご覧ください。
  4. Seasonal:このオプションでは、四半期や月、週などの季節パラメーターに基づいて行をフィルタリングできます。詳しくはこちらをご覧ください。
  5. Outliers:このオプションでは、選択した列のデータ内に存在する外れ値に基づいて行をフィルタリングできます。詳しくはこちらをご覧ください。
Notes
メモ: フィルター設定は、フィルター対象の列のデータ型に基づいて表示されます。

4. フィルターセクションに複数のフィルターを追加すると、論理演算子ANDまたはORがフィルターの横に表示されます。論理演算子をクリックしてANDとORを切り替えることができます。
  1. 論理演算子を使うことで、条件を組み合わせて優先順位のルールを適用できます。最終的な式は条件式ボックスに表示されます。編集をクリックして、論理演算子や括弧を用いて優先順位や評価する順番を指定できます。必要な変更を加えた後は保存をクリックしてください。
  1. 例えば、((1 OR 2) AND (3 OR 4))という式の場合、(1 OR 2)の条件が最初に実行され、次に(3 OR 4)が実行されます。最後にAND演算子が使用されているため、両方の条件が真の場合にフィルターが適用されます。
5. 各フィルターのフィルターオプションに基づき、さらに絞り込んで特定の値を選択できます。


例えば、上記のスクリーンショットでは、Data 品質オプションがフィルターセクションの全ての列フィルターに選択されています。この選択に基づき、さらにフィルターするための設定が全ての列(Data 品質)セクションに表示されます。

6. 最後のセクションで、選択した項目を含めるか除外するかを選択できます。

7. 何らかの理由ですべてのフィルターを削除したい場合は、クリアボタンを使うことができます。

8. フィルター変換の有効なプレビューが、変更を加えるたびに表示されます。

9. 適用するボタンをクリックして、フィルターとともに変換を適用します。