予測モデルの理解

予測モデルの理解

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Info
AI モデルは大幅に刷新され、現在はAI Modelerと名称が変更されています。これにより、アプリ全体で利用できるモデルを作成・トレーニング・公開できるようになりました。この刷新以前にモデルを作成している場合は、こちらをクリックして詳細をご確認ください。
Notes
AI モデルの概要、作成方法、その後の利用方法については、このページを参照してください。
予測モデルは、過去データのさまざまなパターンを分析して、将来の処理や結果を予測します。十分な履歴データを与えると、予測モデルはデータパターンを分析し、それらのパターンと過去の結果との関連付けを学習します。予測モデルは、人工知能(AI) の機能を活用して、新しいデータ内のこれらのパターンを検出・認識し、一定の精度で将来の結果を予測します。予測モデリングのプロセスには、次の作業が含まれます。
  • 履歴データの投入
  • モデルのトレーニング
  • 将来の結果の判定
  • 新しいデータで定期的にモデルを再トレーニングし、自社のニーズに最も適したモデルに到達すること

予測モデルの前提条件

自社のニーズに合わせて結果を予測できるカスタム予測モデルを作成し、トレーニングできます。

必要なスキル

  • 管理者/スーパー管理者は予測モデルを作成して利用できますが、開発者や一般ユーザーは、作成済みモデルの利用のみ行えます。
  • モデルのトレーニングに使用するデータセットを決定できるよう、自社の要件を十分に把握しておくことを推奨します。
  • 予測モデルのトレーニング用データを収集する際には、探索的データ分析(EDA)を実施することが一般的です
  • Creator はローコードプラットフォームのため、ユーザーや管理者に予測モデルの作成や利用に関する事前のコーディングスキルは不要です。また、機械学習(ML)アルゴリズムについて理解している必要もありません。Creator には ML 機能を備えた AI Modeler が用意されています。

必要なデータ

  • トレーニングデータセットには、最低でも50~100件のデータが必要です。ただし、最良の結果を得るには、少なくとも10000件のデータを用意することを推奨します。

必要な料金プラン

  • AI モデルは、Zoho Creator の有料プランをご利用のユーザーが使用できます。詳細は料金ページをご覧ください。

必要な Creator のバージョン

  • カスタム AI モデルを作成するには、Zoho Creator 6(C6)を使用する必要があります。一方、すぐに利用できる AI モデルは、C6 と C5 の両方で利用可能です。

必要なスキルとデータの種類がわかったところで、次のステップは、トレーニングデータとして投入する値をどのように絞り込み、選択するかを理解することです。


たとえば、Creator を使用してZylker Insuranceというアプリケーションを構築したとします。このアプリにはInsurance Claimというフォームがあり、顧客はこのフォームから保険金請求を送信します。ここで、顧客から提出された保険金請求が正当かどうかを判定したいとします。このように、これは二値予測結果モデルの一種です。


次に、予測モデルにどのような結果を出させたいのか、その結果に影響する要因を考えてみましょう。たとえば、「この保険金請求は正当かどうか?」という問いに対して、次のような質問を検討します。

  • 報告された事故の重大度はどの程度か?
  • どのくらいの期間(何か月/何年)信頼できる顧客であり続けているか?
  • 請求されている合計金額はいくらか?
  • 不明な値が含まれる列があり、それが不確実性の原因になっていないか?

    

上記の情報を基に、トレーニングデータとして使用する項目を選定できます。


Info
このページの末尾にあるサンプルデータを使用する場合、問いは「任意の年に、その年の乗用車の価格を予測できるかどうか」です。したがって、乗用車の予測価格は履歴上の結果であり、この情報が空になっている箇所が、予測モデルが予測を行う対象となります。このケースでは、次のような要因(およびその他の要因)を考慮できます。
  1. 乗用車のメーカーと車種
  2. 製造年
  3. トランスミッションと駆動方式


 



モデルで考慮すべき要素が分かったところで、上記の例で予測モデルをどのように利用するかを説明します。

1. 次の手順でモデルを作成します。
    1. 予測したい値を特定します。この例では、顧客から提出された保険金請求が正当どうかを予測します。
    2. 予測に使用するデータを特定します。学習用/履歴/過去データセットには、次の要素が含まれている必要があります。
      1. 信頼できる顧客としての月数
      2. 事故の重大度
      3. 見積もられた請求金額の合計
  • Insurance Claim フォームに、可能な限り多くのデータが含まれていることを確認します。モデルの学習には、すべてのデータを使用することも、特定のデータのみを使用する条件を定義することもできます。たとえば、特定の期間のデータだけをフィルターして使用できます。
Notes
メモ: 学習データをすべて CSV ファイルに保存している場合は、可能な限り多くのデータ列を含めてください。
2. モデルを学習させます。
3. 次の手順でモデルをデプロイします。
  1. まず、先ほど選択した基準項目と従属項目を、フォーム内の対応する項目にマッピングします。予測項目(基準項目)がフォームに追加されます。
  2. 次に、アプリケーションにアクセスし、入力した値に基づいて予測値が予測項目に表示されるようにします。
Notes
メモ:
  1. CSV ファイルから学習データを追加する場合は、項目のマッピングが必須です。
  2. アプリケーションデータを使用して学習データを追加した場合、同じフォームのデータ(項目)を使って構築した予測モデルを、そのフォームにデプロイする際には、項目のマッピングを行う必要はありません。この場合、項目は自動的にマッピングされます。

予測モデルのフロー




学習データの追加

学習データは、モデルがパターンを見つけ、解釈を行い、予測を導き出すために最初に使用されるデータセットですモデルに投入するデータを確定したら、データは次の 2 通りの方法で追加できます。アプリケーションのフォーム項目から追加するか、CSV ファイルから追加します。予測モデルでは、1 つ目の方法(フォームから追加)の場合、学習データは基準項目と従属項目で構成され、2 つ目の方法(CSV から追加)の場合は、基準列と従属列で構成されます。


Info
  1. モデルの結果は常に正確であるとは限りません。これは、他のあらゆる AI と同様です。
  2. モデルの結果は動的です。同じ入力であっても、学習の進み具合によって、異なるタイミングで異なる結果が得られる場合があります。これは、再学習を継続的に行うことで、モデルも継続的に学習していることを意味します。


どの方法で学習データを追加すべきか迷うことがあるかもしれません。アプリケーション内に学習データとして使用できる十分なデータがある場合は、フォームの項目を追加し、その項目のデータを学習データとして使用できます。逆に、アプリケーション内に十分なデータがないものの、ファイルとしてデータを保存している場合は、CSV ファイルからデータを追加する後者の方法を選択できます。


Notes

メモ:

  1. アプリケーションから選択した項目は、学習時の基準項目と従属項目として扱われます。
  2. この CSV から選択した列は、学習時の基準列と従属列として扱われます。

ここで最も重要なのは、履歴の結果列ではないデータ/列が、結果に間接的な影響を受けていないかどうかを確認することです。

たとえば、注文が遅延するかどうかを予測したいとします。データには実際の納品日が含まれているかもしれません。この日付は、注文が納品された後にのみ存在します。この列を含めると、モデルの精度は 100 パーセントに近くなってしまいます。しかし、納品日を予測したい注文については、まだ納品されていないため、納品日列には値がありません。正確な結果を得るには、このような列は学習の前に選択解除する必要があります。

フォーム項目からのデータ

アプリケーションの項目に保存されているデータを選択し、学習データとしてモデルに投入できます。


項目の選択

Info

予測モデルでは、ベース項目および従属項目として追加できる項目タイプは、以下のタイプのみがサポートされます。サポートされていない項目タイプがデータ内に含まれている場合、それらは項目選択ページには表示されません。


  1. 番号 
  2. 小数
  3. パーセント
  4. 通貨
  5. ドロップダウン
  6. ラジオボタン
  7. 日付
  8. 日付-時間

ベース項目と従属項目

トレーニングデータとしてアプリケーションの項目を選択する際には、次の2種類の項目データが必要です。

  • ベース項目は、予測したい結果が入力されている項目です。
  • 従属項目は、予測モデルが予測処理に利用する項目です。


上記のでは、ベース項目は「これは不正請求ですか」となり、従属項目は「顧客期間(月数)」「事故の重大度」「請求合計金額」項目などになります。

データの選択

トレーニングデータとして使用するデータを選択すると、初期設定では、データ内のすべてのレコードが対象になります。ただし、特定のデータセットに絞って学習や予測を行いたい場合もあります。そのような場合は、特定のデータセット のみを使って予測モデルをトレーニングするための条件を定義し、その条件に基づいてデータをフィルタリングできます。トレーニングに使用するデータに不要な情報が含まれているとわかっている場合は、この手順を利用してデータを絞り込むことができます。


たとえば、ある保険会社が Creator を使用して、保険金請求が不正かどうかを予測するアプリケーションを作成しているとします。これを正確に予測するには、モデルをアプリケーションフォーム内のすべてのデータでトレーニングし、モデルの理解度を高める必要があります。


さらに、この保険会社が「事故日が 2018 年より前の請求は処理しない」と定めているとします。この条件を基準として設定すると、2018 年以降に発生した事故に対する請求のみが不正請求の判定対象として考慮されます。このように条件を利用して、データを適切にフィルタリングできます。


すべてのデータ

フォーム内のすべてのデータを使用します。

たとえば、ある保険会社が Creator を使用して、保険金請求が不正かどうかを予測するアプリケーションを作成しているとします。これを正確に予測するには、モデルをアプリケーションフォーム内のすべてのデータでトレーニングし、モデルの理解度を高める必要があります。

特定のデータ

項目、演算子、値を選択して 1 つ以上の条件を定義し、その条件に基づいて、モデルのトレーニングに使用する特定のデータセットのみを選択します。

この保険会社が「事故日が 2018 年より前の請求は処理しない」と定めているとします。この条件を基準として設定すると、2018 年以降に発生した事故に対する請求のみが不正請求の判定対象として考慮されます。

CSV ファイルからのデータ

トレーニングデータを選択するもう 1 つの方法は、CSV形式のファイルに保存されているデータを使用する方法です。サポートされていない項目タイプの列がデータに含まれている場合、それらは列選択ページには表示されません。


列の選択


予測モデルでは、CSV からのトレーニングデータとして、次のデータタイプをサポートしています:番号テキスト日付日付-時間。これらのタイプのデータを、ベース列および従属列として追加できます。


これらのデータタイプ以外の不要なデータを含む列は、CSV 予測ではサポートされません。サポートされていない項目タイプの列がデータに含まれている場合、それらは項目選択ページには表示されません。

ベース列と従属列

この CSV で選択した列は、学習用のベース列と従属列として扱われます。

  • ベース列は、結果を予測したい対象の列です。
  • 従属列は、予測モデルが予測処理に使用する列です。


上記のでは、ベース列は「Fraud Claim」であり、従属列は「Months as Customer」「Incident Severity」「Total Claim Amount」項目になります。

モデルのガイドライン

  • ベース項目/列は、結果を予測するために必須です。
  • 予測モデルには、最大で20個の従属項目/列を追加できます。
  • 1つの予測モデルにつき、20 件の条件を設定できます。
  • 4MBが CSV ファイルの最大ファイルサイズです。
  • モデルを学習させるには、最低50件のデータが必要です。精度を高めるには、10000件を超えるデータを追加して、データをより充実させることをおすすめします。

モデル概要

学習データを追加したら、モデルの詳細を確認できます。確認できる内容には、モデル名ベース項目/列従属項目/列などがあります。必要に応じて、戻ってモデル名ベース項目/列従属項目/列を変更できます。変更が不要な場合は、そのままモデルの学習を続行できます。

モデルを学習する

アプリケーションで予測モデルを実際に使用する前に、期待どおりの結果を出せるように学習させる必要があります。データ項目/列を選択して確認したら、Trainをクリックしてモデルを学習させます。

Notes
メモ: 学習には時間がかかる場合があります。同じページで待機するか、ページを閉じて後で戻ることもできます。学習時間は、モデルのサイズとキュー内の学習モデル数によって異なります。

モデル詳細の表示と管理

モデルのトレーニングが完了すると、モデルの詳細モデルのバージョン、および(存在する場合は)デプロイの詳細を表示できます。モデルは公開およびアプリへのデプロイが可能な状態になります。


Notes
メモ:
  1. 再トレーニングオプションは、フォーム項目からトレーニングデータを追加した場合にのみ利用できます。これは、アプリケーションに新しいデータが継続的に追加されるタイミングで、その都度モデルをトレーニングできるようにするためです。
  2. CSVファイルでデータを追加する場合は、モデルを削除して新しいファイルをアップロードし、再度モデルをトレーニングできます。


モデルは、次の方法で管理できます。

  • 再トレーニング - モデルの再トレーニングとは、デプロイ済みのAIモデルを新しいデータで更新することを指します。新しいデータは常に作成されるため、定期的にモデルを再トレーニングすることを推奨します。これにより、予測モデルの信頼性と精度を向上させることができます。
  • 再トレーニングをクリックすると、モデルが再トレーニングされます。
  • 各再トレーニングの完了後、モデルの新しいバージョンが作成されます。必要に応じて、異なるバージョン間を切り替えることができます。
  • 現在使用中のバージョンを削除する場合は、その前に別のバージョンに切り替えてから、現在のバージョンを削除する必要があります。
  • モデルのトレーニングが失敗した場合は、直前まで正常に動作していたモデルが予測に使用されます。
  • 名前を変更 - 必要に応じて、モデル名を変更できます。
  • 削除 - データの不整合や誤ったデータの追加などの理由でモデルを削除したい場合は、削除オプションを使用できます。

モデルのテスト

Info
モデルをアプリケーションで公開およびデプロイする前に、テストすることを推奨します。

トレーニング後、モデルがどのように動作するかを確認し、トレーニング結果が十分かどうかを判断するためにモデルをテストできます。そのうえで、アプリケーションにデプロイしてください。テストデータをアップロードしてモデルをテストすると、予測結果とともに精度スコアが表示されます。

  • 精度スコア(%)が高い(85〜97)の場合は、モデルを公開して問題ありません。
  • 精度スコア(%)が良好(70〜84)または普通(51〜69)の場合は、新しい値でモデルを再トレーニングすることができます。
  • 精度スコア(%)が低い(50未満)の場合は、データの不整合を確認して修正し、再度モデルをトレーニングする必要があります。

精度スコア

予測モデルは、テストデータセットの予測結果に基づいて、トレーニング済みモデルの精度スコアを算出します。例えば、データセットに500件のデータがあり、そのうち492件を正しく予測した場合、精度スコアは96パーセントと表示されます。


Info
  1. モデルの結果は、常に完全に正確であるとは限りません。これは、あらゆるAIに共通する特性です。結果をより理想的な状態に近づけるため、継続的にモデルをトレーニングしています。
  2. モデルの結果は動的です。同じ入力であっても、マシンの学習状況に応じて、異なるタイミングで異なる結果が生成される場合があります。これは、継続的にトレーニングが行われ、モデルが常に学習し続けていることを意味します。

予測モデルのパフォーマンスを改善する

モデルの学習・テスト・評価が完了したあと、期待した結果が得られない場合は、モデルを編集してパフォーマンスを改善できます。ここでは、モデルの精度スコアを向上させるために試せることをいくつか紹介します。

エラーや問題を確認する

  • モデルの学習に失敗した場合は、モデルの詳細を確認し、再度学習を実行してください。
  • エラーはないものの精度が低い場合は、モデル学習の詳細を確認してください。
  • 可能な限り多くの問題に対処してから、モデルを再学習してください。 次のようなことが原因で問題が発生している可能性があります。
  • アプリケーションデータから学習データを追加する場合、フォームに対応する基準項目と従属項目が存在しないと、モデルの学習が失敗することがあります。この場合は、まずフォームにそれらの項目を作成してから、モデルを学習させてください。


データに基づく修正
  • モデルを学習するには、少なくとも50~100件のデータが必要です。高い精度を持つ予測モデルを学習するには、10,000件以上の正しくラベル付けされたデータを用意することをおすすめします。
  • 正しくラベル付けされた学習データが大量にあっても、必ずしもモデルの性能が高くなるとは限りません。予測に不要な項目/列を選択していると、精度が下がる場合があります。予測に影響を与える関連性の高い列のみを選択し、不要な列は選択解除してください。
  • 予測結果として想定される値の範囲に対応するよう、データにはさまざまなパターンを含めることをおすすめします。たとえば、履歴の結果が完了失敗の2種類あるにもかかわらず、この列のほとんどのデータが完了のみである場合、このような不均衡なデータ分布ではモデルがうまく学習できません。
  • 欠損値が非常に多いデータは避けてください。欠損値には既定値を補完するか、学習データからそのレコードを削除することができます。
  • ある項目/列が予測結果と強い相関を持つ場合は、その列を削除してから、引き続きモデルを学習してください。


データクレンジング

データクレンジングとは、学習データセットから不正確、不適切な形式、重複、または不十分な情報を削除するプロセスです。2つ以上のデータソースを結合すると、データの重複やラベル付けの誤りが発生しやすくなります。予測結果が一見正確に見えても、データの誤りがあると信頼性が損なわれます。


学習データを投入する前にデータをクレンジングすることは、モデルのパフォーマンスを向上させるうえで非常に重要です。各行のデータについて、入力ミス、数値の欠落、スペルミス、その他のエラーを丁寧に確認することが、誤ったデータをクレンジングする最も効果的な方法です。これにより、モデル学習に明らかに不適切なデータを取り除くことができます。

モデルを公開して利用する

モデルの学習が完了したら、モデルを公開してユーザーが利用できるようにし、予測を開始できます。 手順はこちら

Info
モデルを公開できるのは1回のみです。ユーザーにモデルを利用させたくない場合は、モデルを削除できます。

環境機能が有効な Creator アプリケーションで予測モデルを利用するには、そのアプリケーションの少なくとも1つのバージョンが本番環境に公開されている必要があります。アプリケーションにモデルをデプロイしたあと、環境の各ステージでフィルターして、モデルがどのステージにデプロイされているかを確認できます。 手順はこちら


サンプルデータで始める

予測機能をすぐに使い始められるよう、Creator アプリケーションですぐに利用できるサンプルデータを提供しています。以下の添付ファイルをダウンロードして、予測モデルの作成を開始してください。

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho Campaigns Resources

                Zoho WorkDrive Resources




                  • Desk Community Learning Series


                  • Digest


                  • Functions


                  • Meetups


                  • Kbase


                  • Resources


                  • Glossary


                  • Desk Marketplace


                  • MVP Corner


                  • Word of the Day


                  • Ask the Experts









                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.