Zoho DataPrep ユーザーガイド概要

Zoho DataPrep ユーザーガイド概要

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrep は高度なセルフサービス型 ETL ソフトウェアです。複数のデータソースからさまざまなデスティネーションへ、大量のデータを移動し、データ分析やデータウェアハウスを高品質なデータで支援できます。ソースからデスティネーションへデータを移動する際に、データのクレンジング、変換、加工も行えます。DataPrep ではビジュアルなパイプラインビルダーを使ってデータフローを作成し、高度なスケジューリングやワークフロートリガーでデータパイプラインをオーケストレーションし、さらにパイプラインの監視やアラートの受信も行えます。



以下のトピックでは、Zoho DataPrep の利用をすばやく開始し、主な機能を確認し、データパイプラインを設定する方法を説明します。

Zoho DataPrep を使い始める

開始する前に、まず DataPrep プラットフォームをセットアップします。組織をセットアップする
組織のセットアップが完了したら、Zoho DataPrep の主な要素であるホームページエンティティワークスペース詳細ページを簡単に確認し、プラットフォームに慣れましょう。

パイプラインを作成する

まずは最初のデータパイプラインを作成します。

パイプラインにデータを追加する

パイプラインを作成したら、さまざまなデータソースからデータを追加します。DataPrep は、ビジネスアプリ、クラウドストレージ、データウェアハウスなど、70 以上のソースに対応しています。
クラウドデータベース






 

データの変換

データをインポートした後、出力先に合わせてデータを変換したり、データ品質を向上させるためのクレンジング処理を行ったり、外部データソースでデータを拡充したりできます。データブレンディングを行うことも可能です。Zoho DataPrep では、データのクレンジング、準備、拡充のために 250 以上の変換機能を提供しています。AI データ準備エージェントである Ask Zoho Zia を使用すると、自然言語で変換処理を実行できます。

また、Code Studio を使用してデータを変換することもできます。Zoho DataPrep の Code Studio を使用すると、パイプライン内で Python スクリプトを使ってデータを変換できます。

パイプラインビルダーDataPrep Studioでデータの操作を開始できます。DataPrep Studio を使用している場合、スマート選択 を利用してすばやく変換を実行でき、さらに カラムエクスプローラーを使用してデータとその品質を確認できます。
データクレンジング
データクレンジングとは、データ内のエラーを取り除き、不整合を減らし、重複を削除して、データ品質を向上させるプロセスです。以下は、利用できるデータクレンジング用の変換機能の一覧です。

データのブレンドと変換
データブレンディングとは、複数のソースからのデータを1つのデータセットに統合することです。以下は、データのブレンドと変換に使用できる変換機能の一覧です。

データブレンディング:

データの再構成:

数値変換


データの出力先

データを変換した後、パイプライン内でデータの出力先を設定できます。Zoho DataPrep は、ファイル、クラウドストレージ、クラウドデータベース/データウェアハウス、BIツール、業務アプリケーションなど、さまざまな出力先をサポートしています。
クラウドデータベース








お疲れさまでした。これでデータパイプラインの構築が完了しました。次に、パイプラインの実行方法や、オーケストレーション、実行状況の監視方法を確認しましょう。

パイプラインを実行して準備済みデータをエクスポートする

パイプラインを実行し、データをさまざまな宛先にエクスポートできます。手動で実行することも、ソースから宛先までのデータ移動をシームレスにオーケストレーションおよび自動化することも可能です。

手動実行

手動実行は、パイプラインのテストやオンデマンドのワークフロー実行に使用できます。
また、手動リロードを使用して、ソースから最新データを取得し、パイプラインを更新することもできます。
セクション実行を使用すると、パイプラインの特定のセクションだけを実行でき、上流ステージでの変更をパイプライン全体を実行することなく現在のステージにのみ反映させることができます。

ワークフローをオーケストレーションする

データパイプラインの実行を自動化・管理し、シームレスかつタイムリーなデータ移動を実現する方法を確認しましょう。

スケジュールを使用すると、パイプラインを手動操作なしで、指定した間隔で自動実行するように設定できます。


Webhook と API- 外部アプリケーションで発生したイベントに基づき、Webhook または API を使用してパイプラインをリアルタイムでトリガーします。

バックフィル実行を使用すると、一定期間にわたって連続して失敗していたスケジュール済みパイプラインの実行を補完できます。

共有とコラボレーション

ワークスペースやパイプラインを共有して、他のユーザーとシームレスに共同作業できます。


接続、パイプラインテンプレート、ルールセットテンプレートも共有できます。詳細はこちら

設定


組織設定- サブスクリプション、組織管理者、データを管理します。
ユーザー管理- 管理者やユーザーを追加・削除します。
その他の設定- 通知、プライバシー、コンプライアンス、機能設定など。

ホワイトラベル版 Zoho DataPrep

Zoho DataPrep を自社ブランドやドメインに合わせてカスタマイズし、ユーザーにシームレスな利用体験を提供する方法について説明します。

 

サポート範囲と制限事項

ソリューションガイド

データクレンジングやデータ準備の一般的なユースケースに、簡単に対応できる実践的なハウツーソリューションのカタログをご覧いただけます。

お問い合わせ

サポートが必要な場合は、次の方法でお問い合わせください。