Pipeline builderは、ユーザーがDataPrepで複数のデータステージや様々なフロー単位の変換を含むデータフローを作成できるツールです。新規pipelineが作成されると、pipeline builderページが開きます。pipeline builderページには、パイプラインに関するすべての関連情報が表示されます。これには、パイプラインの詳細、データ元の詳細、データセットの詳細、出力先の詳細、さらにundoやredo、データのインポート、バージョン履歴、スケジュール、実行、パイプライン設定などの設定が含まれます。
それでは、詳しく見ていきましょう。
パイプラインの右上にある三点アイコンから、以下の設定を利用できます。
パイプラインビルダーの三点リーダーアイコンを選択し、概要メニューをクリックします。パイプラインの概要では、パイプライン名、作成者、作成日、最終更新日時、最終更新ユーザー、ワークスペース名、ステージ、データソース、デスティネーション、共有ユーザー、スケジュール時刻、最新のジョブ実行、次回のジョブ実行などの詳細を確認できます。また、パイプライン概要から名前の変更、削除、共有も行えます。
バージョン履歴は、パイプライン内のすべての処理履歴を管理するのに役立ちます。公開済みの過去バージョン一覧や、現在有効なバージョンを表示できます。
履歴表示基準の初期設定では、パイプライン内のすべての処理が時系列順に表示されます。必要に応じて、フィルターを使用してバージョンタイプ、ユーザー、日付ごとに履歴を表示できます。
パイプラインビルダーの三点リーダーアイコンをクリックし、Job 履歴オプションを選択すると、特定のパイプラインのすべてのジョブを表示できます。
Jobsページ内のジョブをクリックすると、Job 概要画面へ移動します。Job 概要では、ジョブの詳細が3つのタブで表示されます:概要、Stages、Output。詳細はこちらをクリックしてください。
ユーザーやグループと共有する場合は、ユーザーメールまたはグループ名を入力します。
「メールを送信する通知」チェックボックスを選択すると、ユーザーにメールで通知されます。
過去に共有した連絡先リストからユーザーやグループを選択できます。
「共有する」をクリックすると、パイプラインをユーザーやグループと共有できます。
パイプラインの共有を停止したい場合は、ボタンをクリックしてください。
新しいグループを作成する方法
パイプラインの共有について詳しくはこちらをクリックしてください。
2. 保存 as テンプレートオプションをクリックし、保存 as pipeline テンプレートを選択します。pipelineはテンプレートライブラリにpipelineテンプレートとして保存されます。
また、pipelineテンプレートをダウンロードし、ダウンロードする pipeline as .zdpt オプションを使って利用できます。
3. Workspaceタブで、Pipeline テンプレートに進み、使用する nowをクリックして、保存済みテンプレートを使い新規pipelineを作成します。
共有する with サポートオプションをクリックします。pipelineをサポートチームと共有するとき:
サポートチームに、個人データを含む列をはじめとするパイプライン内のすべてのデータの表示および編集権限を完全に付与します。続行する場合は、共有するオプションをクリックしてください。
サポートチームのアクセス権は2週間後に自動的に失効します。2週間より前にアクセスを取り消したい場合は、このメニューオプションを再度使用して手動でアクセスを取り消すことができます。
このオプションを使用して、パイプラインを削除し、ごみ箱に移動します。削除されたパイプラインは、ワークスペースページのごみ箱タブで確認できます。エンティティを復元するか、ごみ箱から完全に削除することが可能です。ごみ箱内の商品は180日後に完全に削除されます。
ズームイン・ズーム出力 - このオプションでパイプラインのズームインおよびズーム出力が可能です。範囲は60%から100%までです。
Scroll 戻る to content - パイプラインの移動で表示する出力が変わった場合、クリックすると上部のコンテンツへスクロールして戻れます。
メモ: ワークスペースに返品するには、戻るアイコンまたはWorkspace名前をクリックしてください。パイプライン名の名前を変更することもできます。
パイプラインビルダー上部のデータをインポートする アイコンをクリックすると、複数のソースからパイプラインにデータを取り込むことができます。
1. データ元 アイコンを右クリックし、変更する データ元 オプションを選択します。この操作でインポートするページにリダイレクトされ、任意のデータ元からデータを必須としてインポートできます。
2. データ元 アイコンを右クリックし、Datasource 詳細オプションを選択するか、データ元 アイコンをクリックするとデータ元の詳細が表示されます。
追加する Stage- インポートしたデータを使用して新規ステージを追加します。ステージは、データフロー変換の適用中にデータ処理のために作成されるノードです。データ元からインポートされたデータには、初期設定としてステージが作成されます。
パイプラインから削除 - このオプションを使用して、インポートしたデータおよびフローをパイプラインから削除できます。
5. stageアイコンを一度クリックすると、Dataset 詳細(Ruleset、概要)が表示されます。
データセットの概要: 概要では、データセットの名前、作成者、作成日、最終更新者、最終更新日、列、ルール件数、データ品質、データプレビューが一覧表示されます。
また、Prepare Dataを選択してDataPrep Studioページを開き、その他のデータ変換を確認できます。
ルールセット:各トランスフォームがデータセットに適用されると、DataPrepではそれらがルールとして実行順に保存されます。これらのルールを順に並べたリストをルールセットと呼びます。ルールセットはルールセットペインからアクセスでき、ここでステージに適用されたルールの追加、編集、削除が可能です。
データデスティネーションは、データをエクスポートする場所です。クラウドデータベースやZoho CRM、Zoho Analyticsなどの法人アプリケーションが含まれます。DataPrepでは、50種類以上のデータデスティネーションから標準デスティネーション出力を選択し、加工済みデータをエクスポートできます。
7. destination を1回クリックすると、Connection 詳細、フォルダーパス、File エクスポートオプション、ファイル名、File 形式、区切り文字、テキスト区切り文字、行区切り、ファイルエンコーディング、.郵便番号 ファイルとして圧縮、個人データなどの詳細が表示されます。編集オプションをクリックすると、destination 詳細を編集できます。
デスティネーションを右クリックすると、以下のオプションが表示されます。
編集 destination - このオプションでパイプラインのデスティネーションを変更できます。編集 destinationをクリックすると、選択する your destinationダイアログボックスが表示され、DataPrepで50以上のデータデスティネーション出力から標準のデスティネーションを選択することができます。
削除する destination - このオプションを使用して、パイプラインに追加したデスティネーションを削除できます。
スケジュールオプションは、さまざまなソースからのインポート、変換の適用、およびパイプライン内のデスティネーションへのエクスポートを一定間隔で自動実行する際に使用します。また、スケジューリング時にクラウドストレージやCRM、Creatorなどのさまざまなソースから増分データのインポートも可能です。増分データのインポートは、前回の同期以降に新規または更新されたデータのみを取り込む方法です。パイプラインのスケジュール方法について詳しくはこちらをご覧ください。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。