お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
1. Zoho DataPrepとは?
Zoho DataPrepは、詳細なセルフサービス型データ準備ツールであり、組織が複数のデータソースから大量のデータをモデル化、クレンジング、準備、強化、整理し、データ分析やデータウェアハウスに向けて卓越したデータ品質を実現します。コーディングは一切不要です。
2. Zoho DataPrepのクイックウォークスルーセッションを取得することはできますか?
3. Zoho DataPrep 2.0の新機能は?
最近、DataPrepの2.0バージョンをリリースしました。これにより、従来よりも簡単にエンドツーエンドのパイプラインを作成でき、ビジュアルパイプラインビルダーで品質やデータの移動を完全に管理できるようになりました。このパイプラインビルダーを使えば、複数のデータソースからデータを取り込み、データブレンディングを含むさまざまな変換を実行し、単一のパイプラインで複数の宛先へエクスポートすることが可能です。このパイプライン全体をスケジュール化できるため、オーケストレーションやパイプラインの管理、監視が非常に容易になります。ただし、DataPrep 1.0の既存データセットをパイプラインへマッピングし、データセットをグループ化してパイプラインとして表示する必要があります。2.0の詳細はこちらをご覧ください。
4. 最新のZoho DataPrep 2.0バージョンへ移行するにはどうすればよいですか?
DataPrep 2.0バージョンへは、画面上部の「新規バージョンを試す」オプションから移行できます。1.0から2.0へのデータ移行方法については、マイグレーションガイドをご参照ください。1.0から2.0へのデータ移行方法を紹介するクイック動画もご用意しています。
5. Zoho Analytics内でZoho DataPrep機能を利用するには?
Zoho DataPrep 追加する-オン を Zoho Analytics 内で利用できます。データのインポート時にデータを準備オプションから Zoho DataPrep 追加する-オン へアクセスすることができます。または、その他オプションを利用し、データを準備を選択することで、すでに Zoho Analytics に存在するデータのクリーンアップも可能です。
6. Zoho DataPrep 追加する-オン を使って Zoho Analytics の既存データを準備するにはどうすればよいですか?
画面上部のその他オプションをクリックし、データを準備オプションを選択すると、すでに Zoho Analytics に存在するデータのクリーンアップができます。また、DataPrep のインポートフローを通じて Zoho Analytics から Zoho DataPrep へデータを移動し、Zoho DataPrep のすべての機能を活用することも可能です。
7. Zoho DataPrep から Zoho Analytics の既存テーブルへデータをインポートできますか?
Zoho Analytics で DataPrep から直接データをインポートすることはできません。ただし、Zoho DataPrep の出力先として Zoho Analytics を追加し、パイプラインを実行することで Zoho Analytics の既存テーブルにデータを送信することが可能です。
8. Zoho DataPrep でサポートされているコネクタは何ですか?
Zoho DataPrep では現在、以下のコネクタをサポートしており、さらにその他のコネクタも追加予定です。
- Zoho Analytics
- Zoho CRM
- Salesforce
- Zoho Bigin
- Zoho Creator
9. Zoho DataPrepからZoho Analyticsへのデータインポート、またはその逆は可能ですか?
はい。Zoho DataPrepからZoho Analyticsへは、Zoho AnalyticsのデータをインポートセクションでZoho DataPrepコネクターを利用することで、シームレスにデータをインポート可能です。同様に、Zoho DataPrepではZoho Analyticsコネクターを使用して、データのインポートおよびエクスポートが行えます。
Zoho DataPrepにアップロードしたデータへ当社がアクセスすることはありません。すべてのデータは自社データセンターで暗号化されます。収集するのは、商品や機能の利用状況などの基本的な情報のみで、サービス向上や機能改善のために役立てています。情報を外部へ共有することはなく、内部評価の目的のみに使用しますのでご安心ください。
11. Zoho DataPrepで同時に許可されるパイプラインスケジュール数は?
Zoho DataPrep では、利用可能な任意の宛先を追加し、スケジュールの詳細や頻度を設定することで、任意の数のパイプラインスケジュールを任意の時間に実行できます。ただし、処理可能な行数はご利用中のサブスクリプションによって制限されます。
12. 1つのステージ内で作成できる最大の列数は?
Zoho DataPrep では、1つのステージにつき最大400列までサポートしています。これにより、大量のデータも容易に準備できます。
13. Zoho DataPrep で任意のサイズのファイルをインポートできますか?
JSON および XML ファイルは最大20MB、その他の対応ファイルは最大100MBまでインポートできます。対応ファイル形式は CSV、TSV、JSON、HTML、XLS、XLSX、XML です。
14. Zoho DataPrep で一度にインポートできるファイルおよびテーブル数は?
Zoho DataPrep では、一度に最大10個のファイルまたはテーブルのインポートに対応しています。
15. Zoho DataPrep では毎月何行まで処理できますか?
Zoho DataPrep では、
スタンダードプランで毎月最大1億行までデータ処理が可能です。
エンタープライズプランでは、処理可能な行数は1億行から始まり、法人のご要件に応じて毎月数十億行まで拡張できます。
16. Zoho DataPrep の各エディションおよび価格は?
Zoho DataPrep の各種エディションと価格はこちらからご確認いただけます。
17. データ内の無効な値など、データセットの品質問題でエクスポートに失敗した場合はどうすればよいですか?
エクスポートが以下のようなエラーで失敗した場合は、データ内の無効な値を修正する必要があります。
1. データセットの品質スコアが設定された最小品質スコアを下回っているため、エクスポートが中断されました。
2. データセット内に存在する無効なデータが宛先で承認されていない値と等しいため、エクスポートに失敗しました。
データ内の無効な値を見つけるには、次の手順に従ってください。
1. ジョブ概要 ->
Outputタブに移動します。
2. Data 品質記号をクリックして、無効な列を表示します。
3.無効な列の特定後、Job 概要ページで
編集 Pipelineオプションをクリックし、
Studio pageへ移動します。適切な
変換処理を使用して無効な値を修正し、パイプラインを再実行してください。
4. サンプルに無効な値が含まれていない場合でも、全データには含まれていることがあります。その場合は、最終のデータ準備ステージへ移動し、右側のパネルでSample Strategy横の編集アイコンをクリックし、Erroneous sampleを選択して適用するをクリックしてください。
これにより、サンプルデータ内の無効な値が表示されます。無効な値を修正し、ジョブを再度実行してください。
18.受注データを[パッケージ]データに変換するだけで、Zoho DataPrep で .txt ファイルを .csv ファイルに変換できますか?
直接変換は利用できませんが、テキストファイルをインポートしてデータを準備し、CSVファイルとしてエクスポートすることは可能です。
19. スケジュール実行で Cloud Sources へエクスポートできるデータ件数に制限はありますか?
データ件数の制限はありませんが、エクスポート時にバッチサイズ制限が適用されます。バッチサイズ制限についてはこちらをご覧ください。
20. 接続を再認証する方法
Zoho DataPrep では、再認証が必要な場合、スケジュールや他の実行が失敗することがあります。組織から退会した、または無効となったユーザーのスケジュールを引き継ぐことを再認証と呼びます。以下のいずれかの条件が当てはまる場合、スケジュールの再認証が必要です。
- スケジュールを設定したユーザーが組織から削除された場合
- スケジュールを設定したユーザーが無効化された場合
- 使用中の接続が削除されたか、そのユーザーがいなくなった場合
スケジュール編集時に以下のエラーが表示されて失敗した場合は、下記手順でスケジュールの再認証を行ってください。
以下のいずれかの場所から再認証オプションをクリックできます。
1. パイプラインビルダーで、data データ元アイコンを右クリックし、Datasource 詳細 オプションを選択します 、またはdata データ元アイコンを一度クリックしてdata データ元詳細を表示します。 スケジュール作成者が無効化または組織から削除された場合、または使用中の接続が削除された、もしくはユーザーへの共有がなくなった場合、再認証オプションがDatasource 詳細に表示されます。
2. パイプラインビルダーで、対象データセットのStudioページを開き、Rulesetアイコン
をクリックし、続けてData データ元設定アイコンをクリックします。スケジュール作成者が無効化または組織から削除された場合、または使用中の接続が削除された、もしくはユーザーへの共有がなくなった場合、再認証オプションがData データ元詳細に表示されます。
Data データ元 詳細で、接続を再認証するには Re-authenticate オプションをクリックしてください。再認証が完了すると、データのスケジュールを引き続きシームレスに行えます。
transformステージがジョブ概要でCachedと表示されている場合、そのステージのルールや依存する上流ノードに変更がなかったため、データの再処理が行われなかったことを意味します。
例えば、以下のパイプラインを考えてみましょう。

以下は、この例のパイプラインにおけるスケジュールインポート設定です。

最初の手動実行(テスト実行)では、見込み客 2023および見込み客 2024の子データセットに対して「
Cached」ステータスが表示されます。これは、これらがすでにappend変換時に処理済みだからです。そのため、既存データで手動実行を行った場合、それらのステージは再利用され「Cached」となり、その他の変換ステージは「
完了」と表示されます。
ただし、パイプラインを再実行(既存データでの手動実行や、インポート設定が「データをインポートしない」となっている他の実行)し、新しいルールが追加されていない場合、ステージステータスは「Cached」となります。
ルールや入力データに変更がないため、Googleドライブ以外の変換ステージはキャッシュされます。

22. ステージがジョブ概要で「Not run」ステータスを表示するのはいつですか?
ジョブ概要内のステージが「Not Run」ステータスを表示するのは、以下の場合です:
- 既存データでの手動実行
- インポート設定が「データをインポートしない」となっている実行
- 区間実行
これらの場合、パイプラインは新しいデータをデータ元から取得せず、既にインポート済みのデータを使用します。そのため、該当するインポートステージが「Not Run」と表示されます。
例:
例えば、見込み客 2023と見込み客 2024の2つのデータセットが異なるデータ元からあるとします。これらをインポートし、結合(append)し、宛先を追加します。
1. 既存データで手動実行を行うと、インポートする両方のステージは「Not Run」と表示されます。これはデータが再取得されていないためです。
2. 後で、見込み客 2024 データセットにのみルールを追加してセクション実行をすると、見込み客 2024 の変換ステージのみが実行され、「完了」と表示されます。インポートするおよびエクスポートするステージは、データが再度インポートまたはプッシュされていないため、引き続き「Not Run」と表示される場合があります。