予測モデルの理解

予測モデルの理解

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

AIモデルはメジャーアップデートによる刷新を受け、AI Modelerとして新たに名称が変更されました。これにより、モデルの作成、トレーニング、公開を行い、アプリで使用できるようになりました。今回の刷新以前にモデルを作成している場合は、こちらをクリックして詳細をご覧ください。
AIモデルの概要、作成方法、活用方法については、このページをご参照ください。
予測モデルは、過去データにおけるさまざまなパターンを分析し、今後の処理や結果を予測します。十分な履歴データを提供すると、予測モデルはデータのパターンを分析して、それらのパターンと過去の結果をリンクすることを学習します。予測モデルは、人工知能(AI)の力を活用し、新規データからこれらのパターンを参照・認識して、一定の精度で今後の結果を予測します。予測モデルのプロセスは以下の通りです。
  • 履歴データの投入
  • モデルのトレーニング
  • 今後の結果の判定
  • 新しいデータで定期的にモデルを再学習し、法人のニーズに最適なモデルを選定

予測モデルの前提条件

できること 作成 およびトレーニング カスタム prediction models を活用し、法人ニーズに合わせた予測を実現します。

必要なスキルは?

  • 管理者やスーパ管理者は prediction models の作成および使用が可能ですが、開発者やユーザーは作成されたモデルの利用のみ可能です。
  • モデルのトレーニングに使用するデータセットを決定できるよう、ご自身の法人要件について十分に把握しておくことを推奨します。
  • 予測モデルのトレーニング用データを収集する際には、探索的データ分析(EDA)を実施することが標準です。.
  • Creatorは低い-コードプラットフォームであり、作成や利用にあたってユーザーに事前のコーディングスキルは不要です。また、機械学習(ml)アルゴリズムの知識も不要で、Creatorにはml機能を備えたAIモデラーが搭載されています。

必要なデータは?

  • トレーニング用データセットには、最小50~100データが必要ですが、最適な結果を得るためには少なくとも10000データをご用意ください。

必要な料金プランは?

  • AIモデルは、Cの支払い済みプランのユーザーに対して利用可能です。詳細については価格ページをご参照ください。

どのバージョンのCreatorを使用すべきですか?

  • カスタムAIモデルを作成するには、Zoho Creator 6(C6)を使用する必要があります。一方、ready-to-使用する AIモデルは、C6とC5の両方で利用可能です。

必要なスキルやデータの種類を把握できたので、次のステージは、トレーニングデータに入力する値を絞り込んで選択する方法を知ることです。


ここで、Creatorを使って「Zylker Insurance」というアプリケーションを構築したと仮定します。「Insurance Claim」というフォームを追加し、顧客が保険請求を送信できるようにしています。顧客から提出された保険請求が正当かどうかを判定したいと考えています。このケースは二値予測アウトカムモデルの一例です。


次に、予測モデルで導き出したい結果に影響を与える要素について考えてみましょう。例えば、「保険請求が正当かどうか?」という質問に対し、次のような問いを考えてみてください:

  • 報告されたインシデントの重大度はどの程度ですか?
  • どのくらい長い間(番号か月/年)信頼できる顧客ですか?
  • 合計claim金額の見積もりはいくらですか?
  • 不明な項目(列)があり、不確実性の要因となる可能性はありますか?

    

上記の情報を活用してデータを選択できます。


提供されているサンプルデータを活用する
本ページの最後で「希望する年の乗用車の価格を予測できるか?」という問いがあります。そのため、乗用車の予測価格は過去の結果となり、この情報が欠落している箇所で予測モデルが予測の支援を行います。この場合、その他にも以下の要素を考慮できます:
  1. 乗用車のメーカーとモデル
  2. 製造年
  3. トランスミッションと移動


 



モデルに考慮すべき要素が分かったところで、上記の例で予測モデルを使用する方法をご紹介します。

1. モデルを作成するには:
    1. 予測したい値を特定します。ここでは、顧客が提出した請求リクエストが正当否かを予測します。
    2. 予測に使用するデータを特定します。training/historical/前へデータセットには以下の要素が含まれている必要があります:
      1. 信頼できる顧客としての月数
      2. インシデントの重大度
      3. 合計請求金額の見積もり
  • 保険金請求フォームにできるだけ多くのデータを含めるようにしてください。すべてのデータを使用することも、モデルの学習用に特定のデータを使用する条件を定義することもできます。たとえば、特定の期間のデータをフィルターすることも可能です。
メモ: トレーニングデータがすべてCSVファイルに保存されている場合は、できるだけ多くのデータ列が含まれていることを確認してください。
2. モデルをトレーニングします。
3. モデルをデプロイするには:
  1. 最初に、前に選択したベース項目と依存項目をフォーム内の対応する項目にマッピングします。prediction 項目(base 項目) がフォームに追加されます。
  2. 次に、アプリケーションへアクセスし、予測される値が prediction 項目に表示される基準となる値を入力します。
メモ:
  1. CSVファイルを使ってトレーニングデータを追加する場合は、項目マッピングが必須です。
  2. アプリケーションデータを使用してトレーニングデータを追加した場合、同じフォームで予測モデルをデプロイする際は項目マッピングの必要はありません(モデルがそのフォームのデータ(項目)を使って構築された場合)。この場合、項目は自動でマッピングされます。

Prediction モデルの流れ




training Dataの追加

トレーニングデータは、モデルがパターンを見つけ、解釈し、予測を行うために使用中の初期データセットです。 モデルに取り込むデータを確定したら、データは2つの方法で追加することができます:アプリケーションのform項目から、またはCSVファイルから追加できます。予測モデルでは、トレーニングデータはbase項目と依存項目(データ追加の1つ目の方法)およびbase列とdependent columns(2つ目の方法)で構成されます。


  1. モデルの結果は常に正確とは限りません。これは他のAIにも共通する点です。
  2. モデルの結果は動的です。同じ入力データでも、トレーニング時に学習した内容によって異なる結果が出る場合があります。つまり、モデルを継続的に再トレーニングすると、そのたびに学習が進みます。


上記のいずれの方法でトレーニングデータを追加するか迷うことがあるかもしれません。アプリケーションにトレーニングデータとして使用できる十分なデータがある場合は、フォームの項目を追加し、そのデータをトレーニングデータとして利用できます。一方、アプリケーションに十分なデータがないものの、データがファイルに保存されている場合は、CSVファイルからデータを追加する後者のオプションを選択できます。


メモ:

  1. アプリケーションから選択した項目は、トレーニング時の基準項目と依存項目として機能します。
  2. このCSVから選択した列は、トレーニング時の基準列と依存列として機能します。

ここで最も重要なのは、履歴の結果列ではないデータや列が、結果に間接的に影響していないかどうかを確認することです。

たとえば、順番が遅延するかどうかを予測したい場合、データ内に実際の納品日が含まれているかもしれませんが、この日付は順番が納品済みとなった後でしか利用できません。この列を含めると、モデルの精度はほぼ100パーセントとなります。しかし、納品日を予測したい注文はまだ納品されていないため、納品日列には値が入力されていません。正確な予測結果を得るためには、このような列はトレーニング前に選択を解除する必要があります。

フォーム項目からのデータ

アプリケーション項目に保存されているデータをトレーニングデータとしてモデルに取り込むことができます。


項目選択

Predictionモデルでは、以下の項目タイプをベース項目および依存項目として追加できます。サポートされていない項目タイプがデータに含まれている場合、項目選択ページには表示されません。


  1. 番号 
  2. 小数
  3. パーセント
  4. 通貨
  5. ドロップダウン
  6. Radio
  7. 日付
  8. 日付-時間

ベース項目と依存項目

アプリケーション項目をトレーニングデータとして選択する際には、2種類の項目データが必要です:

  • ベース項目は、予測したい結果の項目です。
  • 依存項目は、Predictionモデルが予測処理で使用する項目です。


上記のでは、ベース項目は「Is this a Fraud Claim」となり、依存項目は「Months as 顧客」「Incident Severity」「合計 Claim 金額」項目となります。

データ選択

トレーニングデータ用のデータを選択した後、初期設定では、全てのデータが考慮されます。場合によっては、学習や予測を特定のデータセットに絞って行いたいこともあります。フィルター条件を定義して特定のデータセット予測モデルの学習用データとして抽出できます。この条件は、必要に応じて複数の条件を設定することで指定できます。トレーニングデータに不要な情報が含まれていることが分かっている場合は、この手順を利用してデータをフィルタリングできます。


例えば、保険会社がCreatorを使って保険金請求が不正かどうかを予測するアプリケーションを作成しているとします。これを正確に予測するには、アプリケーションフォームにある全データを使ってモデルを学習させることで、モデルの理解度が向上します。


また、保険会社が「2018年以前の日付のある請求は処理できない」と宣言した場合、その条件を設定することで、2018年以降に発生した請求のみが不正請求の審査対象となります。このような場合は、条件を利用してデータを適切にフィルタリングできます。

特定データ

項目を選択し、オペレーターをトレーニングし、値を設定して、モデルのトレーニングに使用するデータセットを選定するための1つまたはその他の基準を定義します。

保険会社は、事故の日付が2018年より前のすべての請求リクエストは処理できないと宣言しています。この基準を設定すると、2018年以降に発生したリクエストのみが不正請求として判定されます。

CSVファイルからのデータ

トレーニングデータを選択するもう一つの方法は、お持ちのファイルに保存されているCSV形式のデータを使用することです。対応していない項目列が含まれている場合、それらは列選択ページに表示されません。


列の選択


予測モデルは、次のデータ型のCSVからのトレーニングデータをサポートしています:番号テキスト日付、および日付-時間。これら2つの型のデータは、基準列および従属列として追加できます。


トレーニングデータを追加した後、モデルの詳細モデル名ベース項目/列依存項目/列など)を確認できます。必要に応じて、モデル名ベース項目/列依存項目/列を戻って修正することも可能です。特に修正が不要な場合は、そのままモデルのトレーニングを続行できます。

モデルのトレーニング

予測モデルをアプリケーションで実際に使用する前に、期待される結果を得るためのトレーニングが必要です。データ項目/列を選択し確認したら、トレーニングをクリックしてモデルを学習させてください。

トレーニング後、モデルをテストして、パフォーマンスやトレーニングの満足度を確認できます。アプリケーションにデプロイする前に、テストデータをアップロードし、モデルをテストすると、予測結果とともに 精度スコアが表示されます。

  • 精度スコア(%)が高い(85〜97)の場合、モデルを公開できます。
  • 精度スコア(%)がgood(70〜84)または fair(51〜69)の場合は、新しい値でモデルを再トレーニングすることをおすすめします。
  • 精度スコア(%)がpoor(50未満)の場合は、データの不整合がないか確認し、修正してから再度モデルをトレーニングしてください。

精度スコア

予測モデルは、テスト用データセットの予測結果にもとづき、トレーニング済みモデルの精度スコアを算出します。例えば、データセットが500件あり、モデルが492件を正しく予測した場合、精度スコアは96パーセントと表示されます。


  1. AIの特性上、モデルの結果が常に正確とは限りません。結果をより完璧に近づけるため、継続的にモデルのトレーニングを行っています。
  2. モデルの予測結果は常に変化します。同じ入力でも、機械学習の進捗状況によって異なる結果が表示される場合があります。つまり、継続的にトレーニングを実施し、モデルが時間とともに学習を進めていることを意味します。

予測モデルのパフォーマンスを向上させる

モデルの学習、テスト、評価を行った後、期待した結果が得られない場合は、パフォーマンスを向上させるためにモデルを編集することができます。ここでは、モデルの精度スコアを改善するために試すことができるいくつかの方法を紹介します。

エラーや問題点の確認

  • モデルの学習が失敗した場合は、モデルの詳細を確認し、再度学習を行ってください。
  • エラーがないにもかかわらず精度が低い場合は、モデル学習の詳細を確認してください。
  • できるだけ多くの問題を解決し、再度モデルを学習させてください。主な原因としては次のようなものがあります。
  • すべての必須モデルガイドラインが満たされていない場合
  • 誤ったデータがモデルに入力されている場合
  • アプリケーションデータから学習データを追加する場合、該当する基礎項目や依存項目がフォームに存在しないと、モデルの学習が失敗することがあります。その場合は、まずフォーム内にこれらの項目を作成し、モデルを学習させてください。

データに基づく修正
  • モデルをトレーニングするには、最低でも最小50~100データが必要です。高精度な予測モデルを作成するには、正しくラベル付けされた10,000件以上のデータが必要となります。
  • 正しくラベル付けされたトレーニングデータが大量にあっても、必須な予測に関係のない選択済み項目/列が含まれている場合、モデルの精度が上がらないことがあります。予測に影響する関連性の高い列のみを選択し、無関係な列の選択を解除してください。
  • データには、予測結果として想定される設定範囲に相当する様々な可能性を含めることを推奨します。例えば、過去の結果が完了またはFailureの2種類であり、ほとんどのデータがこの列に完了のみの場合、モデルはこの種類の不均衡なデータ分布を参照することが難しくなります。
  • データに高い単価の欠損値が含まれていないことを確認してください。欠損値は初期設定データで補完するか、モデル学習対象からデータを削除することができます。
  • 項目/列が予測結果と高い相関を持つ場合は、その列を削除し、引き続きモデルのトレーニングを続けてください。


データクレンジング

データクレンジングとは、トレーニングデータセットから不正確、不適切な形式、複製、または不十分な情報を除去するプロセスです。2つ以上のデータソースを結合する場合、データの重複やラベル付けミスのリスクが高まります。予測結果が一見正確に見えても、データの誤りにより信頼性が損なわれる可能性があります。


トレーニングデータを投入する前に、データのクリーニングが非常に重要です。これによりモデルのパフォーマンスが向上します。データの各行について、誤字脱字や数値の欠落、スペルミスなどを丁寧に確認すると、不適切なデータを排除する最善の方法となります。こうすることで、モデル学習に明らかに不適合なデータを取り除くことができます。

モデルの公開と利用

モデルのトレーニングが完了したら、公開してユーザーが利用できるようにし、予測を開始できます。方法を見る

モデルの公開は一度のみ可能です。ユーザーにモデルを利用させたくない場合は、モデルを削除できます。

予測モデルを環境対応のCreatorアプリケーションで利用するには、そのアプリケーションのバージョンが少なくとも1つ本番環境で公開されている必要があります。アプリケーションにモデルをデプロイした後、環境の各ステージ間でフィルターして、どのステージにモデルがデプロイされているか確認できます。方法を見る


サンプルデータで始める

予測をすぐに開始できるよう、Creatorアプリケーションですぐに利用できるサンプルデータを用意しています。以下の添付ファイルをダウンロードし、予測モデルの作成を始めましょう!

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



            Zoho Campaigns Resources

              Zoho WorkDrive Resources




                • Desk Community Learning Series


                • Digest


                • Functions


                • Meetups


                • Kbase


                • Resources


                • Glossary


                • Desk Marketplace


                • MVP Corner


                • Word of the Day


                • Ask the Experts









                                • Related Articles

                                • クリエイターにおけるAI機能 - Ziaによるパワーアップ

                                  お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 1. 概要 - Ziaについて Zoho Creatorでは、機械学習と生成AIの技術を活用し、プロンプトベースのアプリ作成やエージェンティックAIによる自律的なタスク実行をはじめとした高度なAI機能を提供しています。 ...

                                Resources

                                Videos

                                Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                eBooks

                                Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                Webinars

                                Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                CRM Tips

                                Make the most of Zoho CRM with these useful tips.