Zoho DataPrepの概要

Zoho DataPrepの概要

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrep とは?

Zoho DataPrep は、コーディング不要でデータ準備を簡素化するために設計された、AI 搭載のセルフサービス ETL プラットフォームです。複数のソースからデータをシームレスに移動・クレンジング・変換・加工し、同時にデータ品質の問題に効果的に対処できます。

直感的なビジュアルパイプラインビルダーにより、大量のデータをさまざまなソースとデスティネーション間で構造化されたデータフローとしてモデリング・整理できます。Zoho DataPrep には、自動ワークフロー、高度なスケジューリング、トリガーベースの実行機能も備わっており、スムーズなデータ移動と監視を実現します。

インテリジェントな自動化と強力なデータ準備機能を組み合わせることで、ビジネスインテリジェンスやデータウェアハウスに適した高品質な分析用データを提供できるよう支援します。




データ準備とは?なぜ重要なのか?

データ準備(一般的にはデータラングリングとも呼ばれます)とは、データの収集、結合、構造化、クレンジング、変換、加工を行うプロセスです。



ビジネスで複数のソースから収集したデータを扱っており、毎日膨大なデータを管理するのが難しい場合は、信頼できるデータラングリングツールが必要です。増え続ける非構造化データを、行動につながるインサイトへと変換する必要性から、多くの組織がデータ準備のアプローチを見直しています。ビジネス上の意思決定に費やす時間のうち、約 80% がデータ準備に費やされていると推定されています(出典: The New York Times)。ほとんどのデータラングリングの作業は、定型的で退屈かつ時間がかかり、手作業で行うにはコーディングの専門知識が必要ですが、自動化が可能です。ここで Zoho DataPrep が役立ちます。ETL(抽出・変換・ロード)プロセスを効率化し、ソースとデスティネーション間のデータ移動を簡素化し、複数システム間でのシームレスなデータ統合を、コードを書かずに実現できます。

たとえば、会社で CRM ソフトウェアを使って売上データを処理しているとします。データには、見込み客の重複レコードや無効な連絡先情報などの問題が含まれているかもしれません。理想的な顧客関係管理を行うには、それらを手作業で修正するしかありません。よく発生する問題としては、欠損データ、重複データ、古いまたは冗長なデータ、コンプライアンスやデータ管理の問題などがあります。これらの問題はビジネスに悪影響を及ぼす可能性があります。従来の方法でこれらを修正しようとすると、問題の複雑さによっては数日から数週間かかり、コーディングの専門知識も必要になります。しかし、数回のクリックだけで、数秒で問題を解決できるとしたらどうでしょうか。

ここからは、Zoho DataPrep でできることをご紹介します。
  1. 欠損データ - 顧客からフィードバックを収集する場合を考えてみましょう。顧客がいくつかの項目を入力し忘れると、システム上で不完全なレコードが発生します。Zoho DataPrep では、空のセルを埋める変換を使って必要なデータを補完したり、フィルターで欠損データを抽出して削除したりできます。
  2. 重複データ - 複数のデータソースがあり、手入力でデータを登録していると、多くの場合で重複データが発生します。Zoho DataPrep では、重複排除変換を使って、重複する行や列を簡単に検出・削除できます。
  3. 古いまたは冗長なデータ - ビジネスにとって価値のない冗長なデータを処理してしまうこともあります。この問題に対処するには、定期的な手動監査が必要になります。Zoho DataPrep では、パイプラインを設定し、インポートとエクスポートのワークフローを自動化することで、常に最新のデータを維持できます。
  4. コンプライアンスの問題 - 個人情報や電子保護対象医療情報(ePHI)を収集する場合、機密性を維持することが極めて重要です。Zoho DataPrep は GDPR および HIPAA に準拠しており、個人データを安全に取り扱います。個人データは、保存時の暗号化、データマスキング、トークナイゼーションによって保護されます。
  5. データ管理 - データ管理はデータ準備と同じくらい重要ですが、大量のデータがある場合は困難になることがあります。Zoho DataPrep のデータカタログ機能を使うと、データ資産の利用状況、ステータス、関連メタ情報に基づいて、データ管理とデータ探索を容易に行えます。
  6. 作業時間の増大 - データ準備における根本的な課題は、作業時間が増大することです。定型作業を自動化することが、データ準備にかかる時間を短縮する最も手早い方法です。Zoho DataPrep では、パイプラインを作成してデータ準備ワークフローを自動化し、アラートを受け取ることができます。

Zoho DataPrep の主な機能

データ準備と ETL に伴う煩雑な作業は、データパイプラインを作成することで、シンプルかつ効率的に行えるようになります。本アプリケーションには、さまざまなソースとデスティネーション間でのデータ移動・データ統合、データ操作のライブプレビュー、データの過去状態のタイムライン、データ品質に関する実用的なインサイトなど、強力な機能が備わっています。以下に主なポイントを紹介します。

1. パイプラインを作成し、ファイル、フィード、クラウドストレージ、データベース、データウェアハウス、Zoho Analytics や Zoho CRM などのビジネスアプリケーションを含む 50 以上のデータソースと 30 以上のデスティネーションに接続できます。これにより、システム間でのシームレスなデータ統合と効率的なデータ移動が可能になります。



2. デスティネーションを追加し、準備済みデータをファイル、フィード、クラウドストレージ、データベース、データウェアハウス、Zoho Analytics や Zoho CRM などのビジネスアプリケーションを含む 30 以上のデスティネーションへエクスポートできます。これにより、システム間でのシームレスなデータ統合と効率的なデータ移動が可能になります。



3. Zoho DataPrep は、データに基づいて変換操作を自動提案します。インテリジェントなサジェスト機能により、スマートな ETL を実行できます。

4. 250 以上のデータ変換と、感情分析、言語検出、キーワード抽出などの AI ベースのデータエンリッチメント機能を利用できます。



5. 自動ワークフローとデータパイプラインにより、ETL プロセスを効率化できます。定型作業を自動化することで、データ準備・データ移動・データ統合にかかる時間を大幅に削減できます。データ準備ワークフローをスケジュールし、アラートを受信することも可能です。



6. データカタログ機能により、データ資産の利用状況、ステータス、関連メタ情報に基づいて、データ管理とデータ探索を行えます。



7. Zoho DataPrep は、データ内の個人情報や電子保護対象医療情報(ePHI)を特定し、マスキングやトークナイゼーションによって機密データのプライバシーを保護し、プライバシーポリシーや GDPR などのデータ保護規制への準拠を支援します。Zoho DataPrep に関連するすべてのデータは、送信中および保存時の両方で常に暗号化されています。

関連情報
Zoho DataPrep に関するよくある質問
料金に関する FAQ
Zoho DataPrep のはじめ方
Zoho DataPrep のパイプラインについて知っておくべきこと