お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Zoho DataPrep の Code Studio を使用したデータ変換では、構造化されたデータパイプライン内で、生データを分析に適した形に加工・準備します。カスタムコードを記述することで、データのクレンジング、変換、準備、強化、再構成を行い、用途に合わせて整えることができます。このプロセスにより、複数のソースからのデータを連携し、欠損値を処理し、新しい計算項目を作成し、複雑なロジックを適用してデータ品質を向上させることができます。例えば、さまざまなソースから流入する CRM データを統合・整理し、より正確なインサイトを効率的に生成できます。
重要: このオプションは US、IN、EU の各 DC でのみサポートされています。
Code Studio へのアクセス方法
1. 既存のパイプラインを開くか、新規パイプラインを作成してデータをインポートします。これにより、データソース用のステージが作成されます。ステージを右クリックし、[コードステージを追加]オプションを選択します。
2. これにより、コードステージと初期設定の出力ステージが作成されます。コードステージを右クリックすると、次の設定が表示されます。
編集: Code Studio エディターを開き、コードを編集します。
削除 – パイプラインからコードステージを削除します。必要に応じて、または誤って削除した場合は、

元に戻すアイコンをクリックして変更を取り消すことができます。
コード入力ステージを追加 – このオプションを選択するとコードステージがハイライトされ、矢印をクリックしてドラッグすることで、任意のステージをコードの入力データとしてコードステージに接続できます。
コード出力ステージを追加 – コードステージに接続された追加の出力ステージを追加します。
3. Code Studio エディターのページが開き、サンプルコードが表示されます。
コードエディター: Code Studio エディター中央のセクションは、データのクレンジングと変換のためにコードを記述・編集・実行する専用の Python 環境です。
ライブラリ: コードエディターの左側にあり、既定のライブラリが含まれています。既定のライブラリとは別に、ファイルやライブラリを Code Studio にアップロードすることもできます。上部の[+ 追加]アイコンをクリックして、新規ファイルの作成、ファイルのアップロード、ライブラリの追加を行います。ライブラリは、すべてのフォルダーとそのファイルを管理するファイルディレクトリとして機能します。
重要: fetch_stage_input_as_dataframe() 内の入力ステージ名と、save_stage_output_from_dataframe() 内の出力ステージ名を、パイプラインで実際に使用しているステージ名と正確に一致するように更新してください。サンプルコード内の 'Stage 1' と 'StoreSalesProcessed' を、実際のコードステージ名と出力ステージ名に置き換えてください。これを行わないと、コードはパイプライン内で正常に実行されません。ステージ名が一致しない場合、実行は失敗し、エラーがスローされます。
4. Code Studio エディターに Python スクリプトを入力し、データの変換と準備を行います。スクリプトには必ず名前を付けて保存してください。
5. 完了したら、上部の テスト実行 をクリックしてスクリプトを検証します。変換は最初の 100 行のデータにのみ適用されます。
メモ: テスト実行で変更されるのはサンプルデータのみであり、全体のデータセットには影響しません。
6. 画面下部の[Output]および[Console]セクションで、テスト実行の結果を確認できます。
Console: デバッグやトラブルシューティングに使用するテキストベースのインターフェイスです。スクリプト内のエラーはここに表示されます。エラーを修正して、再度テスト実行を行うことができます。
Output: 実行されたスクリプトの結果をテーブル形式でプレビュー表示します。
7. 期待どおりの出力が得られたら、変更をデプロイに進めることができます。
8. [Deploy]をクリックします。バージョン名と説明を入力します。デプロイが完了すると、最終出力は出力ステージに保存され、有効化されます。コードをデプロイすると、変更が全データセットに適用されます。[開く]をクリックして出力ステージを開き、DataPrep Studio ページでデータを表示できます。
メモ: コードがデプロイされるまで、出力ステージは無効のままです。DataPrep Studio ページでこのステージにアクセスするには、少なくとも 1 回はコードをデプロイして有効化する必要があります。
10. これで、出力ステージにデスティネーションを追加し、パイプラインを実行してデータをエクスポートできます。
メモ: Code Studio は従量課金制の料金モデルに従います。選択したコンピュート容量に基づいてクレジットが消費されます。例えば、1 GB(2 CPU)の構成では、1 分あたり 1 クレジットを消費します。利用前に支払い設定が構成されていることを確認してください。各デプロイで 1 クレジットが消費されます。コンピュートサイズは、コードの実行とデプロイに使用される割り当てメモリおよび CPU リソースを指します。
既定では、コンピュート構成は 1 CPU、1 GB RAM に設定されています。
パイプラインビルダーの
省略記号アイコンに移動し、ジョブ履歴 オプションをクリックします。ここで実行の詳細を表示できます。
コード実行 フィルターオプションを使用して、これらのパイプラインを絞り込むことができます。
コードエディターのその他の設定
1. 画面右上の省略記号アイコンをクリックすると、次の機能にアクセスできます。
最後にデプロイしたバージョンを実行: 新しい変更を公開することなく、直近でデプロイされたスクリプトのバージョンを実行します。
最後の実行ログを表示: 直近の実行のステータス、ログ、および詳細情報を表示し、パフォーマンスの監視や問題のトラブルシューティングに役立てます。
バージョンの詳細: デプロイ済みスクリプトの各バージョンに関する情報を表示します。
ダウンロード: スクリプトを ZIP ファイルとしてダウンロードします。
2. ⌘ アイコンをクリックすると、Code Studio エディターで使用できる基本的なキーボードショートカットを確認できます。
Code Studio で変更履歴を追跡する
バージョン履歴 オプションを使用すると、パイプラインで行われたすべての処理を追跡できます。パイプラインビルダー上部の
Last saved リンクからバージョン履歴にアクセスできます。ここでは、Code Studio ステージに対して行われたすべての変更が記録されます。これには、ステージ名の変更、コードの更新([保存]をクリックするたび)、入力・出力ステージの追加や変更が含まれます。パイプラインが現在公開済みまたは有効な場合に変更を行うと、更新内容を再公開前に確認できるよう、自動的に下書き状態に戻されます。
SEE ALSO