お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Zoho DataPrep の Code Studio を使用したデータ変換では、構造化されたデータパイプライン内で、生データを分析用に加工・準備します。カスタムコードを記述することで、データのクレンジング、変換、準備、補強、再構成を行い、用途に合わせて整形できます。このプロセスにより、複数のソースからのデータ統合、欠損値の処理、新しい計算フィールドの作成、複雑なロジックの適用によるデータ品質の向上が可能になります。たとえば、さまざまなソースから流入する CRM データを、統合・整理して、より正確なインサイトを効率的に得ることができます。
重要: この機能は US、IN、EU の各 DC でのみサポートされています。
Code Studio へのアクセス方法
1. 既存のパイプラインを開くか、新しいパイプラインを作成してデータをインポートします。これにより、データソース用のステージが作成されます。ステージを右クリックし、[Add Code Stage]オプションを選択します。
2. これにより、コードステージとデフォルトの出力ステージが作成されます。コードステージを右クリックすると、次のオプションが表示されます。
Edit: Code Studio エディターが開き、コードを編集できます。
Delete – パイプラインからコードステージを削除します。必要に応じて、または誤って削除した場合は、

元に戻すアイコンをクリックして変更を取り消せます。
Add Code Input stage – このオプションを選択するとコードステージがハイライトされます。矢印をクリックしてドラッグし、任意のステージをコードステージのタイトルに接続することで、そのステージをコードの入力データとして追加できます。
Add Code Output stage – コードステージに接続された追加の出力ステージを追加します。
3. Code Studio エディターのページが開き、サンプルコードが表示されます。
Code Editor: Code Studio エディターの中央セクションは、データのクレンジングや変換のためにコードを記述・編集・実行する専用の Python 環境です。
Library: Code Editor の左側にあり、デフォルトのライブラリが含まれています。デフォルトライブラリに加えて、Code Studio にファイルやライブラリをアップロードすることもできます。上部の[+ Add]アイコンをクリックして、新しいファイルの作成、ファイルのアップロード、ライブラリの追加を行います。Library は、すべてのフォルダーとそのファイルのディレクトリとして機能します。
重要: fetch_stage_input_as_dataframe() の入力ステージ名と save_stage_output_from_dataframe() の出力ステージ名を、パイプラインで使用しているステージ名と正確に一致するように更新してください。サンプルコード内の 'Stage 1' と 'StoreSalesProcessed' は、実際のコードステージ名と出力ステージ名に置き換えてください。これらを正しく設定して初めて、コードはパイプライン内で正常に実行されます。ステージ名が一致しない場合、実行は失敗し、エラーが発生します。
4. Code Studio エディターに Python スクリプトを入力し、データの変換と準備を行います。スクリプトには名前を付けて保存してください。
5. 完了したら、上部の Test Run をクリックしてスクリプトを検証します。変換は最初の 100 行のデータに対して適用されます。
注: Test Run はサンプルデータのみに変更を加え、完全なデータセットには影響しません。
6. Test Run の結果は、画面下部の Console セクション内の Output と logs で確認できます。
Console: デバッグやトラブルシューティングに使用するテキストベースのインターフェイスです。スクリプト内のエラーはここに表示されます。エラーを修正して、再度テスト実行できます。
Output: 実行されたスクリプトの結果をプレビューするテーブルを表示します。
7. 期待どおりの出力が得られたら、変更をデプロイします。
8. [Deploy]をクリックします。バージョン名と説明を入力します。デプロイが完了すると、最終出力は出力ステージに保存され、有効化されます。コードをデプロイすると、変更はフルデータセットに適用されます。出力ステージを開き、DataPrep Studio ページでデータを確認できます。
注: コードがデプロイされるまで、出力ステージは無効のままです。DataPrep Studio ページでこのステージを有効化してアクセスするには、少なくとも 1 回はコードをデプロイする必要があります。
10. 出力ステージに出力先を追加し、パイプラインを実行してデータをエクスポートできます。
注: Code Studio は従量課金制の料金モデルに従います。選択したコンピュート容量に基づいてクレジットが消費されます。たとえば、1 GB(2 CPU)の構成では、1 分あたり 1 クレジットを消費します。利用前に支払い設定が構成されていることを確認してください。各デプロイで 1 クレジットが消費されます。コンピュートサイズとは、コードの実行とデプロイに使用される割り当てメモリと CPU リソースを指します。
パイプラインビルダーの
省略記号アイコンに移動し、Job history オプションをクリックします。ここで実行の詳細を確認できます。
Code executions フィルターオプションを使用して、これらのパイプラインだけを絞り込むことができます。
Code Editor のその他のオプション
1. 右上の省略記号アイコンをクリックすると、次の機能にアクセスできます。
Run last deployed version: 新たな変更を公開することなく、直近でデプロイされたバージョンのスクリプトを実行します。
View Last Run Logs: 直近の実行のステータス、ログ、詳細情報を表示し、パフォーマンスの監視や問題のトラブルシューティングに役立てます。
Version Details: デプロイ済みスクリプトのバージョン情報を表示します。
Download: スクリプトを zip ファイルとしてダウンロードします。
2. ⌘ アイコンをクリックすると、Code Studio エディターで使用できる基本的なキーボードショートカットを確認できます。
Code Studio で変更履歴を追跡する
Version history オプションを使用すると、パイプラインで行われたすべての操作を追跡できます。Version history には、パイプラインビルダー上部の
Last saved リンクからアクセスできます。ここでは、Code Studio ステージに対して行われたすべての変更が記録されます。これには、ステージ名の変更、コードの更新([Save]をクリックするたび)、入力ステージおよび出力ステージの追加・変更が含まれます。パイプラインが現在公開済みまたは稼働中の場合、何らかの変更を行うと、自動的にステータスが Draft に戻り、再公開前に更新内容を確認できるようになります。
SEE ALSO