ジョブ管理

ジョブ管理

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

パイプラインの実行は「ジョブ」と呼ばれます。ジョブでは、パイプライン内で行われるインポート、変換、エクスポートなどの進行状況や各種統計情報を追跡します。

Jobs」ページに移動するには、画面上部のバー メニューからJobsタブをクリックします。




Jobsタブには、組織内のすべてのワークスペースで実行されたすべてのジョブが一覧表示され、ジョブID、関連付けられているパイプライン、開始および実行時間、ステータス、実行ユーザー、使用ストレージ、処理済み行数などが表示されます。

ジョブ一覧を利用すると、失敗したパイプライン ジョブを特定し、ジョブを再実行することができます。




フィルター:

フィルターのドロップダウンを使用して、ジョブを次の種類別に絞り込むことができます:手動実行(Manual run)データ更新ありの手動実行(Manual run with data)スケジュール実行(Schedule run)バックフィル実行(Backfill run)セクション実行(Sectional run)Zoho FlowWebhookデータの再読み込み、およびコード実行。セクション ジョブを表示するには、含める Sectional Jobsトグルを有効にします。




また、実行ユーザー、パイプライン、ワークスペース、ステータス、実行時間などのフィルター属性を使って、ジョブをフィルタリングおよび検索することもできます。詳細はこちら。

 

また、テーブルヘッダー上部にある各ソートアイコンを使用して、パイプライン、開始時間、ステータス別にジョブをすばやく並べ替えることができます。

 

 


DataPrepでのパイプラインやその他のエンティティについて詳しくは、こちらをクリックしてください。

  

ジョブ概要

Jobsページでジョブをクリックすると、ジョブ概要に移動します。ジョブ概要ページには、パイプライン名、ジョブステータス、実行時間、実行ユーザー、使用ストレージ、処理済み行の合計数、データ間隔、ジョブの開始時刻と終了時刻など、ジョブの主要な実行詳細が表示されます。


Notesメモ: パイプライン ビルダー ページでJob 履歴オプションを選択して、ジョブ概要ページに移動することもできます。



これにより、特定のジョブの詳細なインサイトが得られ、パイプラインが開始から完了までどのように動作したか(全体のステータス、各ステージの結果、エクスポート結果など)を確認できます。これを利用して、問題のトラブルシューティング、パフォーマンスの分析、出力品質の検証を行うことができます。

ジョブが失敗した場合や変更が必要な場合は、「編集パイプライン」をクリックしてパイプラインを修正できます。パイプラインで実行されたすべてのジョブを表示するには、Job 履歴オプションをクリックします。

また、ジョブ概要では、ジョブの詳細が、次の3つのタブで表示されます:Pipeline flowStagesOutputです。 

Pipeline flow

Pipeline flowタブでは、選択したジョブに対してパイプラインがどのように実行されたかを視覚的に表示します。これにより、パイプライン全体を通したデータの流れを把握し、各手順が正常に完了したかどうかをすばやく確認できます。

このタブには、インポート元データソースから、適用された変換処理、最終的なエクスポート先まで、パイプライン ステージの順序が表示されます。フロー内の各ステージには実行ステータスが表示され、完了、失敗、スキップされたステップを簡単に特定できます。また、すべての出力をダウンロードオプションを使用して、すべての出力を1つのZIPファイルとしてダウンロードすることもできます。





Pipeline flow内のステージをクリックすると、そのステージに適用されたルールを表示できます。


 

Stages 

ジョブ概要ページのStagesセクションでは、パイプライン内の各ステージにわたってジョブがどのように実行されたかを包括的に確認できます。実行内容はインポートTransformエクスポートに分けて表示され、それぞれのステージについて概要と詳細の両方を提供します。インポート、適用された変換処理、エクスポートのステータス、処理済み行数、使用ストレージ、開始時刻、終了時刻などの詳細が含まれます。




インポート

インポート ステージでは、ジョブに関係するすべてのデータソースの詳細が表示されます。インポート全体のステータスに加え、成功したインポートと失敗したインポートの件数が表示されます。各データソースごとに、インポート ステータス、インポートされたファイル数、インポートされた行数、使用ストレージ、インポート完了までにかかった時間などの情報が表示されます。


情報アイコンをクリックすると、データソースの詳細を表示できます。ここでは、入力データのデータソースに関する必要な詳細(データソースの種類、パース方法など)を確認できます。

The インポート設定を表示 オプションでは、データソースのインポート設定の概要を確認できます。



Transform

Transforms セクションでは、ジョブ実行時に行われたすべてのトランスフォームの概要が表示されます。トランスフォームの概要に加え、データ品質インジケーター、処理済み行数、ストレージ使用量、処理時間などの詳細も確認できます。このセクションを使用すると、トランスフォームの進行状況をすばやく監視し、対応が必要な失敗ステップを特定できます。



情報アイコンをクリックすると、データに適用されたすべてのルールを表示できます。また、プレビューアイコンを使用して各ステージでの出力をすばやく確認したり、必要に応じて任意のステージのデータをダウンロードしたりできます。



エクスポート

エクスポート ステージでは、ジョブによって作成された最終出力の詳細が表示されます。すべてのエクスポート先が、実行ステータス、データ品質インジケーター、エクスポートされた行数、消費ストレージ、および各エクスポートに要した時間とともに一覧表示されます。このステージを使用すると、処理済みデータが意図した宛先に正常に配信されたことを確認できます。



情報アイコンをクリックして宛先の詳細を表示します。また、プレビューアイコンを使用して各ステージでの出力をすばやく確認したり、必要に応じて任意のステージのデータをダウンロードしたりできます。

ステージステータス

ジョブ実行中に表示されるステータスのスナップショットは次のとおりです。



完了 - ステージがエラーなく実行された場合に表示されるステータスです。

Not run - 手動実行(既存データ)や一部のみの実行、または上流ノードとして依存関係がない場合など、一部のインポートやステージは実行されないことがあります。たとえば、一部のみの実行では、上流での変更は下流に読み込まれますが、新しいインポートは行われません。その結果、インポートステージは実行されません。

Notes
メモ: これらのステージからの行は、処理済み行数の計算には含まれません。

Cached - データが以前の実行ですでに処理されている場合や、この実行で上流ノードとして依存関係がない場合、一部のステージはキャッシュされます。たとえば、A と B という 2 つの独立したステージを持つパイプラインを考えます。A にのみトランスフォームを適用してパイプラインを実行した場合、B は更新されることなく既存データを引き続き使用します。この場合、B はキャッシュされます。

Notes
メモ: キャッシュされたステージからの行も、処理済み行数の計算には含まれません。

Queued - パイプライン実行中に、次のバッチの処理ステージがキューに追加されます。

Failure - エラーのあるステージが失敗した場合に表示されるステータスです。

Output 

Output タブでは、ジョブのすべての出力と、追加された宛先、データ品質、出力ステージ、エクスポートされた行数、使用ストレージ、およびエクスポートに要した時間の一覧を表示できます。 



各出力の情報アイコンをクリックすると、出力の詳細を表示できます。また、出力データをプレビューしたり、出力をダウンロードしたりできます。

FAQ

1. データ内の無効な値など、データセットの品質の問題が原因でエクスポートに失敗した場合は、何をすればよいですか?

エクスポートが次のようなエラーで失敗した場合は、データ内の無効な値を修正する必要があります。

1. データセット品質スコアが、設定された最小品質スコア 100 を下回っているため、エクスポートが中止されました。
2. データセット内に、宛先で許可されていない無効なデータが含まれているため、エクスポートに失敗しました。




データ内の無効な値を見つけるには、次の手順に従います。

1. Job 概要 -> Output タブに移動します。



2. Data 品質 アイコンをクリックして、無効な列を表示します。



3. 無効な列を特定したら、Job 概要ページで パイプラインを編集 オプションをクリックし、Studio ページ に移動します。適切な トランスフォーム を使用して無効な値を修正し、その後パイプラインを再実行します。

4. サンプルには無効な値が含まれていない場合でも、全データには含まれていることがあります。この場合は、最後のデータ準備ステージに移動し、右側のペインで Sample Strategy の横にある編集アイコンをクリックし、Errorneous sample を選択して 適用する をクリックしてください。



これにより、サンプルデータ内の無効な値が表面化します。これらの無効な値を修正し、ジョブを再度実行してください。

2. ジョブの失敗を防ぐために、パイプラインを実行する前にファイルが存在しないことを検証できますか?

Zoho DataPrep 2.0 では、増分取得中、入力ファイルの有無にかかわらずパイプラインジョブが開始されます。ファイルが存在しない場合、ジョブはインポートステージで失敗します。DataPrep はこのような状況を自動的に処理するため、事前に手動で検証する必要はありません。これらの失敗はジョブ概要で確認できます。




3. ダウンロードした出力ファイルのサイズが、Stages タブに表示されるサイズより大きいのはなぜですか?

Zoho DataPrep では、ストレージ使用量を最適化するために、ファイルを圧縮形式で保存しています。このため、DataPrep 内に表示されるファイルサイズは小さくなります。出力データをダウンロードすると、ファイルサイズはより大きくなります。たとえば、DataPrep 上で 1 GB のストレージを使用しているファイルでも、出力としてダウンロードするとそれ以上の容量を占有する場合があります。

SEE ALSO

新しいパイプラインを作成する方法

テンプレートライブラリからパイプラインを作成する方法

手動実行について

スケジュール実行についてはこちらを参照

バックフィル実行についてはこちらを参照