用語集

用語集

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

以下の表は、Zoho DataPrepで使用される一般的な条件について説明します。

用語

説明

アカウント admin

アカウント adminは、DataPrep 組織を作成し、設定するユーザーに与えられる役割です。組織は通常、ひとつの組織に紐づけられます。

追加する data

追加する dataボタンは、ビジュアルパイプラインビルダーで利用できます。このボタンをクリックしてデータをインポートできます。

基本データ型

いくつかの他のデータ型が構築されている基礎となるデータ型です。例:Text

Base 単位

DataPrep では、異なる単位間での変換やデータ分布のヒストグラム表示がBase 単位の上に適用されます。例えば、Temperature データ型の場合、Base 単位は摂氏(°C)です。

基本 Auth

基本 Authは、データをURLからインポートする際に「ユーザー名」と「パスワード」が必要となる認証種類です。

バケッティング

バケッティング手法は、値を複数の範囲(バケット)に分けて、規模の大きいデータをより分かりやすくします。細かい詳細が多いデータの場合、全体の傾向を把握しにくくなることがあります。このように値を範囲ごとにまとめることで、データ全体の傾向を観察しやすくなり、パターンの発見にも役立ちます。

列 header

列 header は、データセット内の列の名前です。

列レベル変換

列レベル変換は、1つまたは複数の列に対してのみ申請済みでき、データ全体には適用されません。例:データ型の変更

設定する schedule

パイプラインをエクスポートする際、Scheduleオプションを使ってスケジュールを作成することで繰り返し実行できます。必要な繰り返し方法や実行時間を選択し、エクスポートスケジュールを作成できます。

コンテキストメニュー

データセットで列名を右クリックするとコンテキストメニューが表示されます。このメニューでは、さまざまな列レベルの変換や、並べ替え・削除・名前変更・列の移動などのアイコンが利用できます。

件数

件数変換では、指定した条件に基づいて列内のデータ出現回数を集計できます。選択した値に一致するパターンごとに、件数を集計することが可能です。

条件式

データセットに変換を適用する際に複数の条件を適用する場合、必須の論理演算子を使って組み合わせることができます。条件の最終的な式は、Criteria expression 項目に表示されます。

カスタム データの種類

カスタムデータ型は、従業員ID、請求書ID、出荷追跡ID、資産IDなど、組織固有のデータの認証に使用します。カスタム データの種類を作成することで、データ内の組織固有カラムに対して標準を設定できます。

独自の日付形式

独自の日付形式クリエーターは、日付や日付-時間の形式を作成するために必要な日付・日付-時間タイルで構成されています。必要な要素をクリックするだけで、日付や日付-時間の形式を作成またはカスタマイズでき、手動で形式を入力する必要はありません。これは日付の形式をカスタマイズする際に表示されます。

カスタム range

カスタム rangeは、バケッティング手法で利用可能なオプションで、値をグループ化する際にバケットラベルを決定するための条件を自身で入力できます。

Data catalog

Data catalogは、データセットの利用状況、ステータス、検索性を管理するのに役立ちます。データセットの準備状況に応じて、スケジューリングや共有も可能です。このセクションはアカウント管理者および組織管理者のみ表示されます。

Data cataloging

Zoho DataPrepのData catalogingは、データアセットの利用状況、ステータス、関連付け済み情報に基づいて、データ管理やデータの発見をサポートします。組織内で意図したユーザーがデータを使用する準備状況を評価・実施する際にも活用できます。

Data 品質 棒グラフ

Data 品質 棒グラフは、各列のデータ品質を可視化します。列のデータの種類に応じて、データ品質を有効データ、無効データ、欠損値に分類します。緑は有効データ、赤は無効データ、灰色は欠損値を表します。

Webhook

Zoho DataPrep では、Webhook を使ってパイプラインをトリガーできます。Webhook は、特定のイベントがデータ元サイトで発生したときに実行されるユーザー定義の HTTP コールバックです。

Data データ元設定

データ元設定アイコンはルールセットペインに表示されます。入力データのデータ元に関する詳細(データ元種類、接続情報、前回・次回インポートのタイムスタンプ、パース情報、インポートのスケジュール有無など)が含まれます。ここからインポートスケジュールの編集も可能です。

データの更新

手動でデータ元から最新データを再読み込みし、ステージを更新できます。スケジュール時に失敗したデータも、手動更新オプションで取得できます。

データの種類

データの種類は、キー属性であり、列に関連付けられています。有効データと無効データを分類し、データ品質を算出します。

データセット変換

データセット全体に適用できる変換処理です。例:結合

データセット

データセットは、関連するデータの個別項目のコレクションです。

日付 picker

日付 pickerは、日付・時間コンポーネントの形式文字列をタイルとしてまとめたコレクションです。サポートされているすべての形式文字列が日付 pickerに組み込まれています。必要な要素をクリックするだけで、手動で形式文字列を入力することなく、日付や日付・時間の形式を作成またはカスタマイズできます。

Delimiter

デリミタとは、通常記号や空白であり、1つの日付・時間要素を別の要素から区切るためのものです。例えば、日付「11/24/2020」では、「/」が日付要素を区切るデリミタとなります。

Derived datatype

これは、基本データ型から派生したデータ型です。例えば、「通貨」は小数データの種類から派生したデータ型です。

形式 string

形式 stringは、yy、dd、mmなどの日付や日付-時間の要素です。さまざまな形式 stringを組み合わせて日付の形式が作成されます。

インテリジェントサジェスト

インテリジェントサジェストは、DataPrepが1つまたはその他のカラムが選択されている際に提案する変換操作です。取り込まれたデータに基づいて、効果的なデータ準備を促進するサジェストが表示されます。

参加する potential

参加する変換を実行すると、DataPrepは両方のデータセットの参加する potentialを自動的に計算し、割合(%)で表示します。これにより、参加する変換に適したデータセットを簡単に選択できます。

設定 as 初期設定

このオプションを利用して、ワークスペースの詳細ページからワークスペースを初期設定として設定できます。DataPrepを起動すると、自動的にそのワークスペースが開きます。

Backfill

Backfillの実行では、データモデルやデータ準備ワークフローの変更により前回のスケジュールで処理できなかったデータを処理できます。

Pipeline builder

Pipeline builderは、DataPrep内で複数のデータステージやさまざまなフローレベルの変換を用いて、ユーザーがデータフローを作成できる場所です。

照合する accuracy

照合する accuracyは、列のデータの種類を変更しようとした際に表示されます。照合する accuracyは、選択した列内のデータ音量のうち、データの種類に準拠している割合(%)を示します。

いいえ Auth

認証を必要としないURLからデータをインポートする場合は、データインポートページでこのオプションを利用できます。

OAuth2。+10、-10

OAuth2。+10、-10は、URLからデータをインポートする際に使用される認証方式です。ClientID、ClientSecret、アクセストークン、更新トークンなどの情報が必要で、URLの認証を行いインポートを許可します。

組織

組織はDataPrepのアカウント管理者によって設定されます。組織は1つのアカウントに紐づいており、アカウント管理者はすべてのワークスペース、データセット、ルールセットテンプレート、保存された外部連携やユーザーグループなど、組織内の各種エンティティに対して読み取り・書き込み・共有の全権限を持ちます。

組織 admin

組織 adminは、DataPrep 設定時にアカウント adminによって指定されます。組織 adminはZoho DataPrepでワークスペースの作成や管理を担当するユーザーです。

Jobs

パイプラインの実行はジョブと呼ばれます。ジョブでは、パイプラインにおけるインポート、変換、エクスポートの進捗状況などを追跡します。

Re-authenticate

Re-authenticateリンクは、スケジュール作成者が無効化または組織から削除された場合、または使用中の接続が削除された、もしくはユーザーと共有されていない場合に、該当スケジュール上に表示されます。

繰り返し method

繰り返し methodは、1つのスケジュールに対する時間間隔を設定します。例えば、インポート処理を24時間ごとに完了させたい場合は、「頻度N時間」と「24時間」をスケジュール作成時に設定できます。

Ruleset

各変換がデータセットに適用されると、DataPrep内でルールとして実行順に保存されます。これらのルールを順番にまとめたリストをRulesetと呼びます。

Ruleset 履歴

Ruleset 履歴では、ルールを作成・更新したユーザー情報、変更日時、およびRulesetに追加されたさまざまな操作内容が記録されます。

Ruleset ペイン

Rulesetペインには、データ元およびデータセットに申請済みのルールが表示されます。Studioページ右上のRulesetアイコンをクリックすると、Rulesetペインが表示されます。

Ruleset テンプレート

Ruleset テンプレートは、さまざまなデータセットで再利用するために保存されたRulesetです。

保存済みデータ外部連携

作成した外部連携は、DataPrepに保存され、後で使用できます。

スケジュール

スケジュールオプションは、さまざまなソースからのインポート、変換の適用、パイプライン内の宛先へのエクスポートを、一定の間隔で自動化するために使用します。

パイプライン

パイプラインは、DataPrepでユーザーが複数のデータステージや多様なフロー単位の変換を含むデータフローを作成できる基本的なエンティティです。

スマートセレクション

スマートセレクションは、列データの一部を選択して変換したい場合に、パターンマッチング記法を使ってさまざまな候補を提案するDataPrepの機能です。

スタジオページ

スタジオページは、データセットを開くと表示されます。このページでデータセットに変換を適用できます。

Studioパネル

StudioパネルはStudioページの右側に表示され、ここでトランスフォームを適用します。

手動実行

手動実行では、既存データでパイプラインを実行しますが、データの更新は行われません。新規データはインポートされません。

タグ

タグはワークスペースやデータセットなどのエンティティに関連付けることで、識別・分類・グループ化が可能です。また、DataPrepではタグをラベルとして利用し、エンティティの素早い検索にも活用できます。

Zoho Flow

Zoho DataPrepでは、Zoho Flowを利用してパイプラインの実行をトリガーできます。Zoho Flowはクラウドアプリケーションを連携させる統合プラットフォームで、利用中のアプリ間の情報交換を自動化するワークフローの設定が可能です。

ターゲットマッチング

ターゲットマッチングでは、ターゲットを設定し、データ元データセットを照合することで、データをエクスポートする前にターゲットに合わせて調整できます。ターゲットデータセットをインポートして、既存のデータ元データセットの列構成、フォーマット、データ型を照合することが可能です。これにより、高品質なデータをスムーズにエクスポートできます。

トップバー

トップバーはStudioページの上部に表示され、データセットスイッチャーとメニューバーグラフが右側にあります。

切り捨て

切り捨て操作を使用すると、データ内のテキスト値の末尾から不要な文字や単語を削除できます。

ユーザーおよびグループのアクセス

ユーザーはユーザーグループを作成し、エンティティを共有できます。ユーザーグループを作成することで、ワークスペースやデータセット、ルールセットテンプレート、保存されたデータの外部連携などのエンティティを、特定のユーザーグループと共有できます。

Wildcard タブ

Wildcardタブを使用して条件を適用し、論理演算子を使って独自の式を作成できます。

Workspace

ワークスペースは、Zoho DataPrepにインポートされたさまざまなデータセットを管理するエンティティです。

Workspace shared ユーザー

Zoho DataPrepでは、ユーザーの項目権限に基づいてロールが割り当てられます。ワークスペースがユーザーと共有されると、DataPrepで項目関連の操作を行うための一定の権限と制限が適用されます。

Workspace 詳細ページ

Workspace詳細ページでは、ワークスペースおよびその子エンティティに関するすべての関連情報を一覧表示します。データセット、ルールセットテンプレート、各データセットの同期ステータスなどの詳細が含まれます。

Zia

Ziaは、Zoho DataPrep全体であらゆるエンティティを検索できる検索機能です。

Zoho Analytics

Zoho Analyticsは、セルフサービス型のBIおよびデータ分析ソフトウェアです。データを視覚的に分析し、魅力的なデータビジュアライゼーションを作成して、データから非表示のインサイトを発見できます。

Zoho Databridge

Zoho Databridgeは、オンプレミスデータ元とZohoアプリケーションを接続し、データをインポートするための軽量な独立型ユーティリティです。つまり、社内ネットワークのデータをZohoアプリケーションへ迅速かつ安全に転送できます。

Zoho WorkDrive

Zoho WorkDriveは、オンラインでファイルの同期・保存およびコンテンツ共同作業を行うためのプラットフォームです。このクラウドストレージサービスを利用してデータをインポートできます。

Zoho CRM

顧客 Relationship Management (CRM)は、企業が営業、マーケティング、顧客サポート活動を一元化し効率化するためのリポジトリとして活用できるソフトウェアプラットフォームの一種です。顧客データを保管し、顧客とのやり取りを管理するための最適なソリューションです。


関連情報
Zoho DataPrep 概要
Zoho DataPrep の開始方法