Zoho DataPrep用Dataikuコネクタ
お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Zoho DataPrepは、データサイエンス、機械学習、人工知能(AI)のために設計されたエンドツーエンドのプラットフォームであるDataikuからデータを取り込むことができます。Dataikuは、組織がデータおよびAIプロジェクトを設計、展開、管理するのに役立ちます。この連携により、データの準備や分析能力の強化、データワークフローの効率化、貴重なインサイトによる意思決定の支援が可能となります。このコネクターを使用すると、ETLワークフローの効率化、スムーズなデータ移動の実現、DataikuとZoho DataPrep間でのデータ統合の簡素化が行えます。
重要: Dataikuでは、すべてのデータおよび増分データの取得のみが可能であり、他の方法はまだサポートされていません。
Dataikuからデータをインポートする方法
1.既存のpipelineを開くか、新規pipelineを作成します。「ホーム」ページ、Pipelinesタブ、またはWorkspacesタブから行い、「追加するdata」オプションをクリックします。
情報: インポートするdataアイコンをpipelineビルダーの上部でクリックすると、複数のソースからデータをpipelineに取り込むこともできます。
2. 左側のペインからその他のアプリカテゴリーを選択し、Dataikuをクリックします。また、検索ボックスでDataikuを検索することもできます。
メモ: 以前に接続を追加済みの場合は、必須接続をクリックし、インポートする操作を続行してください。また、保存済みの外部連携は左側のペインにあるSaved 外部連携カテゴリーからも確認できます。Saved 外部連携の詳細については、こちらをご覧ください。
3. 保存済み外部連携から口座を選択するか、 新しく追加する オプションを使用して新しい勘定を接続してください。
4. ユニークなConnection 名前とドメイン 名前をDataikuのプロジェクトに応じて各項目に入力してください。
メモ: ドメイン 名前はDataiku組織のホームページURLから取得できます。例:zylker.eu-west-3
5. Dataiku 組織のシークレット キーを入力してください。
シークレット キーの取得方法
- 画面右上の権限アイコンをクリックし、権限と設定
アイコンをクリックします。
- API keysタブに移動し、新規 APIキーボタンをクリックします。
- シークレット キー用のラベルと説明を入力します。
- APIキーが作成されたら、コピーしてDataPrepのインポート画面に貼り付けてください。
6. 必須のプロジェクトを選択すると、対応するデータセットとカラムが表示されます。インポートしたいDatasetsおよびColumnsを選択してください。
7. データのインポートが完了すると、
Pipeline builderページが開き、ETLパイプラインに変換を適用し始めることができます。各ステージを右クリックし、
データの準備オプションを選択して、
DataPrep Studioページでデータを準備することも可能です。変換の詳細については
こちらをクリックしてください。
メモ: Dataiku 組織から複数のデータセットをインポートする場合、各データセットが上記のようにDataPrep内でステージとして作成されます。
8. データフローの作成と各ステージで必要な変換の適用が完了したら、ステージを右クリックし、
出力先を追加してデータフローを完了できます。
メモ: ETLパイプラインに出力先を追加した後、まず手動実行でパイプラインの実行をお試しください。手動実行が正しく動作することを確認した後、自動化のためにスケジュール設定が可能です。さまざまな実行タイプについてはこちらをご参照ください。
スケジュール
パイプラインはスケジュールオプションで設定できます。
スケジュール設定
1. パイプラインビルダーでScheduleオプションを選択します。
2. 繰り返し方法(毎時間、毎日、weekly、月間)を選択し、Perform 頻度ドロップダウンで頻度を設定します。 Perform 頻度ドロップダウンの設定は、選択した繰り返し方法によって変わります。こちらをクリックして詳細をご確認ください。

3. インポートする新しいデータを取得したいGMTを選択します。データ元の新規データがインポートされます。初期設定では、ローカルタイムゾーンが選択されています。
4.スケジュールを一時停止する条件(次の後): このオプションを使用すると、選択した回数分の失敗が発生した後にスケジュールを一時停止できます。
情報: 範囲は2から100まで設定できます。初期値は2です。
インポート設定
インポート設定オプションを利用して、Dataiku組織からインクリメンタルデータをインポート・取得する方法を設定できます。
メモ: パイプライン内のすべてのソースにインポート設定が必要です。設定しないとスケジュールを保存できません。
5. こちらをクリック リンクを選択して、インポート設定を行います。
6. How to インポートする data from データ元? ドロップダウンから必要なオプションを選択します。このオプションを使って、すべてのデータをインポートするか、データをインポートしないかを選べます。
すべてのデータをインポートする
このオプションでは、Dataiku プロジェクトから利用可能なすべてのデータがインポートされます。

データをインポートしない
データは一度だけインポートされます。2回目以降は、同じデータにルールが適用され、エクスポートされます。

7. 保存をクリックして、データのインポートをスケジュールします。
メモ: すでにDataikuでスケジュールを設定している場合は、インポートする configuration セクション内で 編集 schedule オプションをクリックして新しいスケジュールを設定すると、これまでの設定に基づいてデータが再読み込みされます。
Schedule 設定
無効な値が存在する場合にエクスポートを停止: この設定を有効にすると、準備されたデータに無効な値が残っている場合、エクスポート処理が停止します。

エクスポートの順番
複数の出力先を設定している場合、どの順番でデータを各出力先にエクスポートするかを決めたい場合に、このオプションを利用できます。
無効の場合、エクスポートは初期設定の順番で実行されます。
メモ: このオプションは、パイプラインに2つ以上の出力先を追加している場合のみ表示されます。
エクスポート先の順番を並べ替える方法
1) エクスポートの順番トグルをクリックします。
2) drag and dropで送信先の順番を変更し、保存をクリックします。
メモ: 順番を再度並べ替えたい場合は、編集 順番リンクをクリックしてください。
8. スケジュールの設定が完了したら、保存 をクリックしてスケジュールを実行します。これによりパイプラインが開始されます。

スケジュール実行ごとにジョブとして保存されます。パイプラインがスケジュールされると、データソースからデータが取得済みとなり、各ステージで適用した一連の変換によってデータが準備されます。その後、データ統合を通じて、データはエクスポート済みの状態で指定した保存先に通常の間隔で送信されます。この完了プロセスはジョブ履歴に記録されます。
9. 特定のパイプラインのジョブ一覧に移動するには、パイプラインビルダー内の
三点リーダーアイコンをクリックし、Job 履歴メニューを選択して、パイプラインのジョブステータスを確認します。
10. 必要な job IDをJobs 履歴ページでクリックすると、Job 概要へ遷移し、そのジョブの詳細を確認できます。
Job 概要では、パイプラインフローで実行されたジョブの履歴が表示されます。こちらをクリックして詳細をご確認ください。
11. スケジュールが完了すると、パイプラインで準備されたデータが設定された宛先へエクスポートされます。
情報: できることは、Jobsページ上でスケジュールのステータスも後から表示できます。
メモ: パイプラインにさらに変更を加えた場合、その変更内容は下書きバージョンとして保存されます。下書きオプションを選択し、パイプラインを「変更反映可能」な状態に設定してください。そうすることでスケジュールに反映されます。

スケジュールを設定した後は、以下の操作を選択できます: スケジュールの一時停止 またはスケジュールの再開、スケジュールの編集および スケジュールの削除は、Schedule有効オプション(パイプラインビルダー内)で行えます。
スケジュールを編集し保存した場合、次のジョブは前回のスケジュール実行時間から次のスケジュール済みデータ間隔で実行されます。
重要:Zoho Dataiku を送信先として追加し、DataPrep から Dataiku へデータをプッシュすることは、まだサポートされていません。