Zoho DataPrepのルールセット

Zoho DataPrepのルールセット

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。




このページでは、以下のセクションについて説明します。
  • Rulesetとは?
  • Data データ元 設定
  • Rulesetの操作
  • 個人ルールによる設定
  • Ruleset テンプレート

Rulesetとは?

各変換がデータに申請済みになると、DataPrepではその変換をルールとして実行順に保存します。この順序付きリストをRulesetと呼びます。RulesetはRulesetペインからアクセスでき、申請済みのルールを追加、編集、削除できます。

Rulesetへのアクセス方法

Rulesetには以下の場所からアクセスできます。

1. ステージを右クリックし、rulesetを表示オプションをPipeline builderページで選択します。



Stage 詳細ペインが開き、申請済みのすべてのルールが表示されます。追加/編集ルールボタンをクリックすると、DataPrep Studioページに移動します。次に、アイコンをクリックすると、Rulesetペインが表示されます。



2. また、DataPrep Studioページの右上にあるアイコンをクリックすることで、Rulesetペインを表示できます。



ルールの追加

1. Rulesetペインがスライドして開き、表示されます。ステージのデータ元が初期設定でRulesetの一番上に追加されているのが確認できます。



2. Rulesetパネルは最初は空です。最初のルールを追加するには、列メニューまたは上部ツールバーから変換を選択し、適用するをクリックします。最初のルールがRulesetパネルに表示されます。このルールはいつでも編集、削除、並べ替えが可能です。

3. 新しい変換を適用するたびに、初期設定で、次のルールとして追加されます。



ルールの操作

4. ルールセット内で最新(最後)のルールより前のルールを選択すると、データグリッドがその時点でのサンプルの状態を反映して更新されます。変換パネルから、そのルールに適用された変換を編集できます。

5. サンプルの前の状態にいる場合、ルールセットパネル内で以降のすべてのルールがグレー表示されます。

6. 前の状態で新しい変換を適用すると、新しいルールが現在選択中の直後に追加されます。

7. この時点で、新しいルールより後のすべてのルールが再計算され、変換が実行されます。これにより、以降のルールでエラーが発生した場合は、赤色で強調表示されます。

8. 例として、新しいルールで列「Modified_Time」を削除し、その列が次のルールで使用されている場合、そのルールは実行できず、赤色で強調表示されるため、問題に対処できます。



データ元の詳細

データ元の詳細にアクセスするには:

1. ルールセットアイコンをクリックして、ルールセットパネルを表示します。

2. ルールセットパネルがスライドして開き、表示されます。ルールセット上部に初期設定で追加されたステージのデータ元が表示されます。

3. データ元タイル内の アイコンをクリックして、データ元の詳細パネルを開きます。



4. ここには入力データのデータ元に関する必要な詳細が表示されます。内容はデータ元の種類、接続情報、最終インポート日時と次回インポート予定、パース情報、およびインポートがスケジュールされているかどうかなどです。

5. データ元接続の情報は、データ元の種類に応じてここで編集できます。

6. インポートのスケジュールを一時停止、削除、または編集することができます。



7. ファイルパーシング詳細オプションの横にある展開ボタンをクリックすると、ファイルパーシングの詳細が表示・編集できます。

8. これにより、ファイルエンコーディング、デリミタ、テキスト修飾子などのパーシング詳細が表示されます。



9. File encodingドロップダウンには、下表のすべてのエンコーディング方式が一覧表示されます。
 

IBM00858

IBM857

ISO-8859-6

US-ASCII

windows-1253

UTF-8

IBM862

ISO-8859-7

UTF-16

windows-1254

IBM437

IBM866

ISO-8859-8

UTF-16BE

windows-1255

IBM775

ISO-8859-1

ISO-8859-9

UTF-16LE

windows-1256

IBM850

ISO-8859-2

ISO-8859-13

windows-1250

windows-1257

IBM852

ISO-8859-3

KOI8-R

windows-1251

x-IBM737

IBM855

ISO-8859-4

KOI8-U

windows-1252

x-IBM874

x-UTF-16LE-BOM

ISO-8859-5

 

 

 

 

10. Delimiter ドロップダウンでは、カンマ(,)、タブ、セミコロン(;)、スペース、パイプ(|)などの区切り文字を選択できます。

11. Text qualifier を使用すると、データがシングルクォートまたはダブルクォートで囲まれている場合のみ、テキスト データの種類として認識されます。

12. Data contains header オプションを選択すると、Row as header 項目でヘッダーとして設定する行番号を入力できます。
選択した行番号のデータが、対応する列の列名として置き換えられます。



ルールセット操作

すべてのルール、または必要に応じて選択したルールに対してルールセットの操作を実行できます。各設定について確認しましょう。  
  1. 検索する
  2. テンプレートとして保存
  3. rulesetをインポートする
  4. rulesetをエクスポートする
  5. rulesを並べ替え
  6. Ruleset履歴
  7. rulesを無効にする


アイコンをRulesetパネル右上でクリックし、Ruleset内で検索を実行します。例として、列名を検索して、その列に適用されているすべてのrulesを見つけることが可能です。


テンプレートとして保存

テンプレートとして保存 オプションは、Rulesetをテンプレートとして保存する際に使用します。Rulesetテンプレートは、あるステージから保存され、再利用可能なrulesetです。ルール全体をテンプレートとして保存することも、特定のルールのみを選択してrulesetテンプレートとして保存することもできます。

テンプレートとして保存するには、

1. アイコンをクリックし、テンプレートとして保存 オプションを選択して、すべてのrulesをrulesetテンプレートとして保存します。また、特定のrulesのみを選択してrulesetテンプレートとして保存することも可能です。
hh


2. テンプレート名説明(任意)を入力し、保存をクリックします。rulesetテンプレートの詳細は、こちらをご覧ください。

メモ: 解析の詳細は、ruleset内のすべてのrulesがテンプレートとして保存された場合のみ保存されます。

rulesetをインポートする

rulesetをインポートするオプションを使うと、保存済みのrulesetテンプレート(.ZDRT形式のファイルまたはワークスペース)を現在のステージにインポートできます。rulesetをインポートすると、テンプレート内のrulesが現在のrulesetの最後のルールの後に追加されます。

メモ: インポートしたrulesetテンプレート内のrulesは、現在のステージの最後のルールの後に追加されます。
rulesetをインポートするには、

1. アイコンをクリックし、rulesetをインポートする オプションを選択します
 
2. 既存のワークスペースからルールセットテンプレートをインポートする場合は、ワークスペースからオプションを選択してください。

3. ファイル(.ZDRT形式)からルールセットテンプレートをインポートする場合は、ファイルからオプションを選択してください。

4. インポートするルールセットテンプレートで現在のパース詳細をデータ元設定パネルで置き換えたい場合は、パース詳細を上書きのチェックボックスを選択してください。



メモ: テンプレートの詳細については、Ruleset テンプレートセクションをご参照ください。

ruleset のエクスポート

このオプションを使って、ruleset を .ZDRT 形式のファイルとしてダウンロードし、後で ruleset にインポートできます。特定のルールのみを選択してファイルとしてエクスポートすることも可能です。

ruleset をエクスポートするには、

1. アイコンをクリックし、ruleset のエクスポートオプションを選択します。

2. ruleset 全体をエクスポートしたい場合は、ruleset のエクスポートオプションを選択してください。



3. ruleset 内の特定のルールのみをエクスポートしたい場合は、必要なルールを選択し、ruleset のエクスポートを選択してください。



4. ファイル名説明を入力し、エクスポートをクリックします。

ruleset の並べ替え

このオプションを使って、ruleset 内の1つまたは複数のルールを並べ替えることができます。例えば、複数のルールを選択して上に移動すると、選択したすべてのルールが最初に選択したルールの上に配置されます。

ルールを並べ替えるには、

1. アイコンをクリックし、ルールの並べ替えオプションを選択します。

2. 必要なルールを選択し、必要に応じて最上部、最下部、上、または下に移動してください。ドラッグ&ドロップでもルールを並べ替えることができます。

3. 変更内容を適用をクリックします。



メモ: 並べ替え後にエラーが発生した場合は、ポップアップが表示され、「続ける」または「元に戻す」オプションを選択できます。

Ruleset 履歴

3点アイコンからRuleset 履歴をクリックすると、Ruleset のタイムラインにおける変更内容を表示できます。Ruleset の履歴には、ルールを作成・更新したユーザー情報、変更が行われたタイムスタンプ、およびRuleset に追加された各種変換内容が含まれます。



rules を無効化

このオプションを使用すると、1つまたは複数のルールを無効化できます。ルールを無効化するには、対象のルールを選択し、三点リーダーメニューから「無効化」オプションを選択してください。これにより、該当ルールが無効化され、残りのルールでデータの変換が再計算されます。有効化したい場合は、再度三点リーダーメニューから操作できます。


メモ: 無効化オプションは、1つまたは複数のルールが選択されている場合のみ表示されます。

個別ルールの操作

各ルールに対して、関連付けられた操作を実行できます。三点リーダーアイコンをクリックし、以下の必要な設定を選択してください。
  1. 編集
  2. 移動
  3. 削除
  4. 複製
  5. 無効化
  6. この前にルールを挿入
  7. 情報の表示


各操作の詳細を見ていきます。

編集

編集をクリックすると、ルールに適用された変換を編集できます。Transformパネルで内容を修正し、プレビューで出力を確認してください。適用をクリックすると変更が保存され、変換結果が再計算されます。

移動

移動オプションを使って、1つまたは複数のルールをルールセット内の先頭、末尾、上、下へ移動できます。たとえば、複数のルールを選択して「上へ移動」を実行すると、すべての選択したルールが最初に選択したルールの上に配置されます。



削除

削除をクリックすると、ルールセットから1つまたは複数のルールを削除できます。これによりルールが削除され、残りのルールでデータの変換が再計算されます。

ヒント: ルールを誤って削除しても、いつでも元に戻すことが可能です。元に戻すアイコンは、データグリッド左上に表示されています。

複製

複製オプションを利用して、同じルールを複製または再適用できます。同じ変換を複数回適用したい場合に便利です。

無効化

このオプションを使用すると、ルールセット内のルールを無効化できます。ルールが無効化されると、残りのルールでデータの変換が再計算されます。再度有効化したい場合は、三点リーダーメニューから有効化できます。

この前にルールを挿入

Insert rule が次の前オプションを使うと、ルールの前に手順を挿入できます。また、ルールをクリックすると表示される空の差し込み項目からルールの後に挿入することも可能です。変換を適用すると、その変換のルールが差し込み項目に保存されます。


情報を表示

表示 infoオプションをクリックすると、特定のルールに関する情報(作成者や更新者など)を確認できます。作成・更新日時や、変更を加えたユーザー一覧などの詳細も含まれています。
メモ: Ruleset 履歴 オプションを利用すると、Ruleset内のすべてのルールに関する追加情報も確認できます。


Ruleset テンプレート

Ruleset テンプレートは、さまざまな段階で保存されたRulesetを再利用できるものです。

Rulesetをテンプレートとして保存するには、

1. 必要なデータを開き、画面右上のRulesetアイコンをクリックしてRulesetペインを表示します。

2. アイコンをクリックし、保存 as テンプレートを選択します。

3. テンプレートに名前説明を入力し(例:「Marketing data」)、保存をクリックします。



ruleset テンプレートのカスタマイズ

特定のルールを選択し、ruleset テンプレートとして保存できます。

ruleset テンプレートをカスタマイズする手順

1. テンプレートとして保存したいルールを選択します。

2. アイコンをクリックし、テンプレートとして保存オプションを選択します。

3. テンプレートにテンプレート名説明を入力します。

4. 保存をクリックします。



Ruleset テンプレートの管理

ワークスペース内で利用可能なRuleset テンプレートをすべて表示するには、

1. ワークスペースの詳細ページからRuleset テンプレートタブを選択します。

2. ワークスペースで利用可能なruleset テンプレートは、最終更新日順に表示されます。



4. ruleset テンプレートをクリックすると、ルールの一覧が表示されます。テンプレートの作成者と作成日時も確認できます。



5. テンプレートの共有は、Ruleset テンプレートタブ内の共有アイコンから行えます。

6. 個人ユーザーグループ内の複数ユーザーに招待メールとともに共有できます。



7. チェックボックスを使って複数のrulesetをまとめて共有・削除することもできます。



よくある質問(FAQs)

1. ruleset テンプレートを適用した場合、すでにスケジュールされているデータセットにも自動的に反映されますか?

データセットまたはステージのルールセット内のrules 利用可能は、頻度パイプラインスケジュール実行時に申請済みとなります。ルールセット テンプレートではありません。パイプラインのルールセットにルールセット テンプレートを適用し、その後スケジュール設定することで、自動的に申請済みが取得されます。パイプラインでのスケジュール実行についてもご参照ください。

関連情報