テキストとパターンマッチング

テキストとパターンマッチング

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrep では、以下のテキストおよびパターンマッチングタイプに対応しています。

テキストリテラルテキストリテラルは、データ内の指定したテキストと完全に一致するものを検索する際に使用します。

正規表現正規表現は、指定した表現に基づいてデータと照合する際に使用します。たとえば、正規表現 ^\d+ は、入力データの先頭から任意の桁数の数字に一致させる場合に使用されます。

パターンパターントークンは、正規表現よりもシンプルで読みやすい代替手段を提供します。

以下のセクションでは、Zoho DataPrep におけるパターンマッチングの仕組みについて説明します。

パターン

DataPrep でサポートされている各パターンのトークンと構文を、次の表にまとめています。

文字パターン

これらのトークンは、テキストデータ型の1文字または複数文字に適用されます。
 パターン
説明
{alpha}
すべてのアルファベット [A-Za-z] のセット
{alpha_numeric}
すべてのアルファベットおよび数字 [A-Za-z0-9] のセット
{lower}
すべての小文字 [a-z] のセット
{upper}
すべての大文字 [A-Z] のセット
{digit}
すべての整数の集合 [+10、-10-9]
{番号}
すべての整数および小数の集合
{special_character}
すべての特殊文字の集合 [例: -/,*&^%#@! など]
{white_space}
空白文字(' ')
{any}
すべての文字の集合
{other}
すべての非ASCII文字の集合
{'constant'}
シングルクォートまたはダブルクォートで囲まれた指定テキストに一致
{word}
すべてのアルファベット、数字、およびアンダースコアのセット、つまり {alpha_numeric}(アンダースコアを含む)
{ユーザー名}
@で始まる文字列
{hashtag}
#で始まる文字列

位置パターン

これらのトークンはテキストデータの種類に対して位置を指定する際に適用されます。
  
パターン
説明
{開始する}
折れ線グラフの開始位置
{end}
折れ線グラフの終了位置

パターンの構築

データを照合するためのパターンを作成する際、以下のルールが適用されます。
  1. パターントークンは「{ }」で囲みます。
    例:{alpha}

  2. トークンの後に「*」を付けると、0回またはそれ以上の出現回数と照合します。
    例:{alpha}*

  3. トークンの後に「+」を付けると、1回またはそれ以上の出現回数と照合します。
    例:{alpha}+

  4. トークンの後に数字を付けると、指定回数だけ出現するものと照合します。
    例:{alpha}{3}

  5. トークンの後に「{ }」で下限値と上限値を指定すると、指定した範囲内の回数で照合します。
    例:{alpha}{2,5}

  6. 定数は「' '」で囲んでトークンを作成します。
    例:{'Bob'}
複数のトークンを連続して追加することで、複数条件を持つ完全なパターンを構築できます。いずれか2つのパターンのいずれかと照合したい場合は、「 | 」による論理OR条件を2つのパターンの間に使用します。
例:{'Bob'} | {'Robert'}

パターン例

1. テキスト内の最初の単語と一致させるパターン

入力データ

DataPrepはパターンマッチングに対応しています。

パターン

{開始する}{alpha}+

一致したデータ

DataPrep


2. 国際電話コードの下3桁と一致させるパターン

入力データ

+1 340

パターン

{digit}{3}{end}

照合済みデータ

340

 
3. クレジットカード番号を照合するパターン:

入力データ

1234-1234-1234-1234

パターン

{開始する}{digit}{4}{special_character}{digit}{4}{special_character}{digit}{4}{special_character}{digit}{4}{end}

照合済みデータ

1234-1234-1234-1234


4.国際電話コードの下3桁を照合するパターン。
Notesメモ{開始する} および {end} トークンを含めることで、パターンがセル全体の値に一致した場合のみデータを照合できます。

関連情報