Dataikuからデータをインポートする [ベータ]

Dataikuからデータをインポートする [ベータ]

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Zoho DataPrepは、データサイエンス、機械学習、人工知能(AI)のために設計されたエンドツーエンドプラットフォームであるDataikuからデータを取り込むことができます。Dataikuは、組織がデータやAIプロジェクトの設計、展開、管理を支援します。この連携により、データの準備と分析機能の強化、データワークフローの効率化、貴重なインサイトを通じた意思決定の促進が可能となります。

Info
重要:Dataikuでは、すべてのデータのインポートおよび増分データの取得は、まだサポートされていません。

Dataikuからデータをインポートする方法

1.既存のpipelineを開くか、新規作成するには、ホームページ、PipelinesタブまたはWorkspacesタブから、データを追加オプションをクリックします。

Info情報: パイプラインビルダーの上部にあるデータをインポートアイコンをクリックすることでも、複数のソースからパイプラインにデータを取り込めます。


2. 左側のペインでその他のアプリカテゴリを選択し、Dataikuをクリックします。検索ボックスでDataikuを検索することも可能です。



Notesメモ: 以前に追加済みの接続がある場合は、必須の接続をクリックしてインポートを続行してください。保存済みの外部連携は、左側のペインにあるSaved 外部連携カテゴリからも確認できます。Saved 外部連携について詳しくは、こちらをご覧ください。

3. 保存済みの外部連携から口座を選択するか、新しく追加するオプションを使用して新しい勘定を接続してください。



4. プロジェクトのConnection 名前ドメイン 名前を、それぞれの項目に入力してください。(Dataikuから取得)
Notes
メモ: ドメイン 名前は、Dataiku組織のホームページURLから取得できます。



5. Dataiku組織のシークレットキーを入力してください。

シークレットキーの取得方法

  1. 画面右上の権限アイコンをクリックし、「権限と設定」アイコンをクリックしてください。
  2. API keysタブに移動し、新規 APIキーボタンをクリックします。
  3. シークレットキー用のラベルと説明を入力します。
  4. APIキーが作成されたら、それをコピーしてDataPrepのインポート画面に貼り付けてください。


6. 必須のプロジェクトを選択すると、対応するデータセットとカラムが表示されます。インポートしたいデータセットカラムを選択してください。



7. データのインポートが完了すると、Pipeline builderページが開き、トランスフォームの適用を開始できます。ステージを右クリックし、データ準備オプションを選択して、DataPrep Studioページでデータを準備することも可能です。トランスフォームの詳細についてはこちらをクリックしてください。



Notes
メモ: Dataiku 組織から複数のデータセットをインポートする場合、各データセットは上記のようにDataPrep内で個別のステージとして作成されます。

8. データフローの作成が完了し、各ステージに必要なトランスフォームを適用したら、ステージを右クリックして宛先を追加し、データフローを完了させます。

Notesメモ: パイプラインに宛先を追加した後は、まず手動実行でパイプラインをテストできます。手動実行で問題がなければ、スケジュール設定を行い、自動化が可能です。さまざまな実行方法についてはこちらをご参照ください。

スケジュール

スケジュールオプションを使用してパイプラインの実行を設定できます。

スケジュール設定

1. パイプラインビルダーでScheduleオプションを選択します。

2. 繰り返し方法(毎時間、毎日、weekly、月間)を選択し、Perform 頻度ドロップダウンで頻度を設定します。Perform 頻度ドロップダウンの設定は繰り返し方法によって変わります。こちらをクリックして詳細をご覧ください。




3. インポートしたい新しいデータがデータ元に見つかった際に使用するGMTを選択します。初期設定ではローカルタイムゾーンが選択されています。

4.一時停止する schedule が次の後: このオプションでは選択する ことで、n 回の失敗後にスケジュールを一時停止することができます。
Info情報: 範囲は2から100の間で設定可能です。初期値は2です。

インポートする configuration

Dataiku 組織からインクリメンタルデータをインポートおよび取得する方法をインポートする configurationオプションで設定できます。
Notes
メモ: インポートする configuration は、パイプライン内のすべてのソースに対して設定する必要があります。インポートする configuration を設定しない場合、スケジュールを保存できません。

5. インポートする configuration を設定するには、こちらをクリックリンクを選択してください。

6. How to インポートする data 差出人 データ元?ドロップダウンから必須オプションを選択します。このオプションを使用して、すべてのデータをインポートするか、データをインポートしないかを選択できます。

すべてのデータをインポート  

このオプションを選択すると、Dataikuプロジェクトから利用可能なすべてのデータがインポートされます。

 

 


データをインポートしない   

データは一度だけインポートされます。2回目以降は、同じデータに対してルールが適用され、エクスポートされます。

 




7. 保存をクリックして、データのインポートをスケジュールします。

メモ: すでにDataikuでスケジュールを設定している場合、「インポートする設定」セクションの以前の設定に基づいてデータが再読み込みされます。編集スケジュールオプションをクリックして新しいスケジュールを設定するときに適用されます。

スケジュール設定

無効な値がある場合にエクスポートを停止:この設定を有効にすると、準備したデータに無効な値が残っている場合、エクスポートが停止されます。



順番エクスポート

複数の出力先を設定し、データのエクスポート先の順番を指定したい場合に、このオプションを利用できます。

この機能が有効でない場合、エクスポートは初期設定の順番で実行されます。
Notes

メモ: このオプションは、パイプラインに2つ以上の出力先を追加している場合のみ表示されます。

エクスポート先の順番を並べ替える方法

1) 順番エクスポートトグルをクリックします。

2) drag and dropで送信先の順番を変更し、保存をクリックします。



Notes
メモ: 順番を再度並べ替えたい場合は、編集 順番 リンクをクリックしてください。

8. スケジュール設定が完了したら、保存 をクリックしてスケジュールを実行します。これによりパイプラインが開始されます。



スケジュール実行ごとにジョブとして保存されます。パイプラインをスケジュールすると、データはご利用のデータソースから取得済みとなり、各ステージで適用した一連の変換処理によって準備され、その後、データはエクスポート済みの状態で宛先に通常の間隔で送信されます。この完了プロセスはジョブ履歴に記録されます。


9. 特定のパイプラインのジョブ一覧に移動するには、パイプラインビルダー内の三点リーダーアイコンをクリックし、Job 履歴メニューからパイプラインのジョブステータスを確認できます。

10. Jobs 履歴 ページで目的のjob IDをクリックすると、Job 概要ページに移動し、該当ジョブの詳細を確認できます。

Job 概要では、パイプラインフロー内で実行されたジョブの履歴が表示されます。こちらをクリックして詳細をご確認ください。

11. スケジュールが完了すると、パイプラインで準備されたデータが設定された宛先にエクスポートされます。

Info

情報: できることは、スケジュールのステータスを後でJobsページで表示することも可能です。

Notes

メモ: パイプラインにさらに変更を加えた場合、変更内容は下書きバージョンとして保存されます。下書きオプションを選択し、パイプラインを「準備完了」として設定することで、スケジュールに変更が反映されます。




スケジュールを設定した後は、次の操作が可能です: スケジュールの一時停止 またはスケジュールの再開スケジュールの編集および スケジュールの削除Schedule有効オプション(パイプラインビルダー内)から実行できます。

スケジュールを編集して保存した場合、次のジョブは最終スケジュール実行時刻から次回のスケジュールデータ間隔に基づいて実行されます。


Info
重要:Zoho Dataiku を宛先として追加し、DataPrep から Dataiku へデータをプッシュすることは、現在サポートされていません。

関連情報