テキストとパターンマッチング

テキストとパターンマッチング

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。


Zoho DataPrep では、以下のテキストおよびパターンマッチングタイプがサポートされています。

テキストリテラル:テキストリテラルは、データ内の指定したテキストと完全に一致するものを照合する際に使用します。

通常表現:通常表現は、指定した表現に基づいてデータを照合するために使用します。たとえば、正規表現 ^\d+ は、入力データの先頭から任意の桁数の数字に一致させる場合に利用します。

パターン:パターントークンは、通常表現よりも簡単で読みやすい代替手段を提供します。

以下のセクションでは、Zoho DataPrep でのパターンマッチングの仕組みについて説明します。

パターン

次の表は、DataPrep でサポートされている各パターンのトークン一覧と構文です。

文字パターン

これらのトークンは、テキストデータ型内の1文字または複数文字に適用されます。
 パターン
説明
{alpha}
すべてのアルファベット [A-Za-z] のセット
{alpha_numeric}
すべてのアルファベットと数字 [A-Za-z0-9] のセット
{lower}
すべての小文字 [a-z] のセット
{upper}
すべての大文字アルファベット [A-Z] の集合
{digit}
すべての整数の集合 [+10、-10〜9]
{番号}
すべての整数および小数の集合
{special_character}
すべての記号文字の集合(例: - / , * & ^ % # @ ! など)
{white_space}
空白文字(' ')
{any}
すべての文字の集合
{other}
すべての非ASCII文字の集合
{'constant'}
シングルクォートまたはダブルクォートで囲まれた指定のテキストに一致します。
{word}
すべてのアルファベット、数字、アンダースコア({alpha_numeric}、アンダースコアを含む)のセットです。
{ユーザー名}
@で始まる文字列
{hashtag}
#で始まる文字列

位置パターン

これらのトークンは、テキスト データの種類に対する相対位置に適用されます。
パターン
説明
{開始する}
折れ線グラフの開始位置
{end}
折れ線グラフの終了位置

パターン構成

データを照合するためのパターンを作成する際、次のルールが適用されます。
  1. パターントークンは「{ }」で囲みます。
    例:{alpha}

  2. トークンの直後に「*」を付けると、0回またはそれ以上の出現回数と照合します。
    例:{alpha}*

  3. トークンの直後に「+」を付けると、1回またはそれ以上の出現回数と照合します。
    例:{alpha}+

  4. トークンの直後に数字を付けると、指定した回数だけ出現するものと照合します。
    例:{alpha}{3}

  5. トークンの直後に「{ }」で下限値と上限値を囲むことで、指定範囲内の回数と照合します。
    例:{alpha}{2,5}

  6. 定数は「' '」で囲んでトークンを作成します。
    例:{'Bob'}
複数のトークンを連続して追加することで、複数の照合条件を持つパターン全体を作成できます。2つのパターンのいずれかと照合したい場合は、「 | 」を使用して論理OR条件を2つのパターンの間に入れてください。
例:{'Bob'} | {'Robert'}

パターン例

1. テキスト内の最初の単語に照合するパターン。

入力データ

DataPrepはパターンマッチングに対応しています。

パターン

{開始する}{alpha}+

照合済みデータ

DataPrep


2. 国際電話コードの最後の3桁を照合するためのパターン。

入力データ

+1 340

パターン

{digit}{3}{end}

照合済みデータ

340

 
3. 貸方カード番号を照合するためのパターン:

入力データ

1234-1234-1234-1234

パターン

{開始する}{digit}{4}{special_character}{digit}{4}{special_character}{digit}{4}{special_character}{digit}{4}{end}

照合済みデータ

1234-1234-1234-1234


Notesメモ: {開始する}および{end}トークンを含めることで、パターンがセル値全体に一致する場合のみ、データを照合できます。

関連情報