理解予測モデル

理解予測モデル

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

AIモデルは大幅な改良を経て、AI Modelerとして再命名され、アプリをまたいで使用できるモデルを構築、トレーニング、公開することができるようになりました。この改良前にモデルを作成した場合は、こちらをクリックして詳細をご確認ください。 
AIモデルについて、その作成、および消費についての詳細を学ぶためには、こちらのページを参照してください。
予測モデルは、過去のデータの分析によって将来のイベントや結果を予測します。十分な歴史的データを提供すると、予測モデルはデータパターンを分析し、それらのパターンを歴史的な結果とリンクさせるように学習します。予測モデルは、新しいデータのパターンを学習し、認識し、ある程度の精度で潜在的な結果を予測するために、人工知能(AI)の力を借ります。予測モデリングプロセスには次のものが含まれます。
  • 過去のデータの投入
  • モデルの学習
  • 将来の結果の決定
  • 新しいデータを用いてモデルを定期的に再学習し、ビジネスニーズに基づいて最適なモデルを導出する

予測モデルの前提条件

ビジネスニーズに合わせた予測結果を予測するためのカスタム予測モデルを構築したり、訓練することができます。 

何の知識が必要ですか?

  • (管理者/スーパー管理者)は予測モデルを作成し使用することができますが、開発者やユーザーはあなたが作成したモデルのみを使用することができます。 
  • モデルのトレーニングに使用するデータセットを決定するために、すべてのビジネス要件を十分に理解することが推奨されます。 
  • モデルをトレーニングするためのデータを収集する際に、探索的データ分析(EDA)を行うことが望ましいです 
  • Creatorはローコードプラットフォームなので、モデルの作成と消費にあたって、あなたやユーザーが事前のコーディングスキルを持つ必要はありません。また、機械学習(ML)アルゴリズムを知る必要もありません。CreatorにはML機能を持つAIモデラーがあります。 

何のデータが必要ですか?

  • 最低でも50 -100 のレコードがトレーニングデータセットに必要ですが、最良の結果を得るためには少なくとも10000レコードが必要です。

どのプランに入る必要がありますか?

  • AIモデルは、プロフェッショナルとアップリミテッドプランのユーザーに利用可能です。詳しくは、当社の料金ページをご覧ください。

どのバージョンのCreatorを使用するべきですか?

  • Zoho Creator 6(C6)を使用してカスタムAIモデルを作成する必要がありますが、ready-to-use AI modelsは、C6とC5の両方で利用可能です。

例 

今、必要なスキルやデータの種類を理解したところで、次のステージは、トレーニングデータに入力する値を絞り込んで選択する方法を知ることです。 


仮定しましょうとCreatorを使用して名前を付けたアプリケーション「Zylker Insurance」を構築しました。 「Insurance Claim」という名前のフォームを追加しました。このフォームで顧客が請求要求を提出します。 顧客から提出された保険請求が正当かどうかを確認したいと思います。これは、バイナリ予測結果モデルの一種です。 


今、当該予測モデルが行う出力に影響を及ぼす要因を考えてみましょう。例えば、「保険請求が正当かどうか」という質問に対して、次のような質問を考えてみます。

  • インシデントの影響度を教えてください。
  • 彼らが信頼できるお客様である期間は何ヶ月/何年ですか?
  • 請求額はいくらですか?
  • カラム内に不明な要素があり、不確実性を生じる可能性がありますか?

    

上記の情報を使用してデータ選択を行うことができます。 


このページの最後に提供されているサンプルデータを利用して、質問は「私が望む年に車の価格を予測できますか?」です。そのため、車の予測価格は歴史的な結果であり、情報が空欄の場所では、予測モデルが予測を行うのに役立つでしょう。この場合、次の要因などを考慮することができます。 
  1. 車の種類とモデル
  2. 製造年
  3. 変速機と走行距離


 



今、モデルに考慮すべき要素を知ったところで、上記の例で予測モデルをどのように使用するかをご覧ください。

1. モデルを作成するために:
  1. 顧客からの請求要求が正当なものかどうかを予測することを決めました。でないかどうか。
  2. 予測に使用するデータを特定します。トレーニング/歴史/以前のデータセットは次の要素をカバーする必要があります。
    1. 信頼できる顧客としての月数
    2. 事故の重大度
    3. 請求金額の総額
  • あなたの保険請求フォームにできるだけ多くのレコードを確保することです。モデルトレーニングにすべてのレコードを使用するか、特定のレコードを使用するための特定の条件を定義することができます。たとえば、特定の時期のレコードをフィルタリングすることができます。
注: もし全てのトレーニングデータをCSVファイルに保存している場合、可能な限り多くのデータ列を持つようにしてください。 
2. モデルを訓練します。
3. モデルを以下のようにデプロイしてください: 
  1. 最初に、先ほど選択したベースフィールドと依存フィールドをフォーム内の関連するフィールドにマッピングします。予測フィールド(ベースフィールド)がフォームに追加されます。
  2. 次に、アプリケーションにアクセスし、予測される値を表示するための値を入力します。
注意:
  1. CSVファイルを使用してトレーニングデータを追加する場合、フィールドマッピングは必須です。
  2. アプリケーションレコードを使用してトレーニングデータを追加した場合、同じフォームからモデルが構築され、そのフォームのデータ(フィールド)で予測モデルがデプロイされた場合は、フィールドマッピングを実行する必要はありません。この場合、フィールドは自動的にマッピングされます。

予測モデルフロー




トレーニングデータの追加

モデルがパターンを見つけ、解釈を行い、予測を導くために使用する最初のデータセットをトレーニングデータといいますモデルにフィードするデータを最終的に決定したら、 2つの方法でデータを追加できます:アプリケーション内の フォームフィールドから、または CSVファイルからです。 予測モデルにおいて、トレーニングデータは、最初のデータ追加方法で ベースフィールドと依存フィールド 、後者の方法では ベースカラムと依存カラムで構成されます。


  1. モデルの結果は必ずしも正確でない場合があります。AIを用いた場合も同様です。
  2. モデルの結果は動的です。同じ入力が異なる時間に異なる結果を生じる可能性があります。これは、モデルを再訓練しながら学習を継続していることを意味します。


あなたは、上記のトレーニングデータを追加する方法のどちらを選択するべきかという疑問を持つかもしれません。アプリケーションにトレーニングデータとして使用するための十分なレコードがある場合は、フォームからフィールドを追加して、そのレコードがトレーニングデータとして使用されることができます。また、アプリケーションに十分なレコードがないが、ファイルにデータが保存されている場合は、CSVファイルからデータを追加する後者のオプションを選択することができます。 


注意

  1. アプリケーションから選択したフィールドは、基本フィールドと依存フィールドとしてトレーニングに使用されます。
  2. このCSVから選択した列は、基本列と依存列としてトレーニングに使用されます。

ここで最も重要なことは、歴史的な結果列ではないレコード/列が間接的に結果に影響を及ぼしているかどうかです。

例えば、注文が遅延するかどうかを予測したいとします。データには実際の配送日があるかもしれません。この日付は注文が配送された後にのみ表示されます。この列を含めると、モデルの精度はほぼ100%になります。配送日を予測したい注文はまだ配送されていないため、配送日列が埋められていません。正確な結果を得るためには、トレーニングの前にこのような列を選択解除する必要があります。 

フォームフィールドからのデータ

アプリケーションフィールドに格納されたデータをモデルへの学習データとして投入することができます。  


フィールド選択

予測モデルは、基本フィールドと依存フィールドとして追加することができる以下のフィールドタイプをサポートしています。サポートされていないフィールドタイプを持つデータがある場合は、フィールド選択ページに表示されません。


  1. 数字 
  2. 小数
  3. パーセント
  4. 通貨
  5. ドロップダウン
  6. ラジオ
  7. 日付
  8. 日付時刻

基本フィールドと依存フィールド

トレーニングデータとしてアプリケーションフィールドを選択する際に、2つのタイプのフィールドデータが必要です。

  • 基本フィールドは、予測したい結果のフィールドです。 
  • 従属フィールドは、予測モデルが予測プロセスに使用するフィールドです。 


上記のでは、基本フィールドは「これは不正請求ですか?」であり、従属フィールドとして「顧客としての月数」、「事故の深刻度」、「請求総額」などがあります。

レコードの選択

あなたがトレーニングデータのレコードを選択した後、 デフォルトでは、すべてのレコードからのデータが考慮されます。 時には、 あなたは特定のレコードセットに焦点を当てて学習し、予測を行いたいかもしれません。あなたは、必要に応じて一連の条件を設定して、 特定のレコードセット をフィルタリングするための条件を定義できます。 あなたが予測モデルをトレーニングするために使用するレコードに関係のない情報が含まれていることを知っている場合、このステップを使用してデータをフィルタリングすることができます。


想定してみましょう。保険会社がCreatorを使用して、保険請求が不正であるかどうかを予測するアプリケーションを構築しているとします。正確に予測するためには、アプリケーションフォーム内のすべてのレコードをモデルに学習させる必要があり、そうすることでモデルの理解を拡大することができます。 


さて、保険会社が2018年以前の事故日付のすべての請求書を処理できないと宣言したとしましょう。この条件が入力された場合、2018年以降に提出された請求書のみが不正請求として考慮されます。この場合、条件を使用してレコードを適切にフィルタリングできます。


すべてのレコード

フォームからすべてのレコードを使用します。

保険会社がCreatorを使用して、保険請求が不正であるかどうかを予測するアプリケーションを構築すると仮定します。正確に予測するには、モデルをアプリケーションフォームにあるすべてのレコードで訓練する必要があり、そうすることでモデルの理解を広げることができます。

特定のレコード

フィールド、演算子、値を選択して、特定のレコードセットのみをモデルの学習に使用するための一つ以上の基準を定義します。

保険会社は、2018年以前の事故日付を持つすべての請求を処理できないと宣言しました。これが基準として入力された場合、2018年以降に発生した請求のみが不正請求として考慮されます。

CSVファイルからのデータ

トレーニングデータを選択する別の方法として、 CSV形式のファイルに格納されているデータを使用することができます。サポートされていないフィールド列がある場合、それらは列選択ページに表示されません。


列の選択


予測モデルは、次のデータ型のCSVからの学習データをサポートします: 数値テキスト、日付および日時。 これら2つの型からのデータを基本列および依存列として追加できます。 


CSVの予測でサポートされていない不要なデータを含む列がある場合、それらはフィールド選択ページに表示されません。これらの2つのデータ型のいずれにも該当しない場合は、サポートされていません。

ベースと依存する列

このCSVから選択される列は、トレーニングのための 基礎 および 従属 列として機能します。

  • 基本列は、結果を予測したい列です。 
  • 従属列は、予測プロセスに使用したい予測モデルです。 


上記のでは、基本列は「不正請求」であり、従属列として「顧客としての月数」、「事故の深刻度」、「請求総額」フィールドがあります。

モデルガイドライン

  • 予測の結果を出すためには、基本のフィールド/カラムが必要です。
  • 予測モデルには、最大で 20個の依存フィールド/列を追加することができます。
  • 最大で20個の条件を予測モデルに追加できます。
  • 4MB は、CSVファイルの最大ファイルサイズの制限です。
  • モデルをトレーニングするためには、少なくとも 50 レコードが必要です。より高い精度を達成するためには、 10000 レコード以上を追加してデータをより豊かにすることができます。

モデルの概要

訓練データを追加した後、 モデルの詳細を確認することができます (例:モデル名ベースフィールド/カラム従属フィールド/カラム)。 必要な場合は、モデル名ベースフィールド/カラム従属フィールド/カラムを修正することができます。 そうでなければ、モデルを訓練する準備ができました。 

モデルを訓練する

予測モデルをアプリケーションで実際に使用する前に、それを実行して期待される結果を生成するように訓練する必要があります。データフィールド/列を選択してレビューした後、モデルを訓練するには訓練をクリックします。

注意: トレーニングには時間がかかる場合がありますので、同じページを開いたまま待つか、ページを閉じて後で戻ってきてください。トレーニング時間はモデルサイズとキュー内のトレーニングモデルの数によります。

モデルの詳細の表示と管理

学習モデルが完成したら、モデルの詳細、モデルのバージョン、およびそのデプロイメントの詳細(ある場合)を確認できます。モデルは、現在公開およびアプリへのデプロイの準備ができています。


注意
  1. フォームフィールドを使用してトレーニングデータを追加する場合のみ、再学習 オプションが利用可能です。 これは、アプリケーションに新しいレコードが継続的に追加されると、モデルをトレーニングできるためです。
  2. CSVファイルを使用してデータを追加する場合は、モデルを削除し、新しいファイルをアップロードしてから、モデルを再度トレーニングできます。


モデルを以下のように管理することができます:

  • 再学習 - モデルの再学習とは、新しいデータで展開されたAIモデルを更新することを指します。新しいデータが常に生成されているため、定期的にモデルを再学習することをおすすめします。これにより、予測モデルの信頼性と正確性を向上させることができます。 
  • クリックすると、再学習が行われます。
  • 再学習が終わると、新しいモデルのバージョンが作成されます。必要に応じて、異なるバージョン間を切り替えることができます。
  • 現在使用中のバージョンを削除する場合は、削除の前に他のバージョンに切り替える必要があります。 
  • モデルの学習が失敗した場合は、以前に動作していたモデルが予測に使用されます。
  • 名前を変更 - 必要に応じてモデルの名前を変更できます。
  • 削除 - 不整合や誤って追加されたデータを削除したい場合は、「削除」オプションを使用してください。

テストモデル

模型を公開してアプリケーションに展開する前に、模型をテストすることをお勧めします。 

トレーニング後、モデルをテストして、モデルがどのように動作しているか、トレーニングが満足できるかどうかを確認することができます。テストデータをアップロードし、テストモデル後、 精度スコアとともに予測結果を得ることができます。 

精度スコア(%)が高い(85-97)場合は、モデルを公開することができます。精度スコア(%)が良い(70-84)または普通(51-69)の場合は、新しい値でモデルを再訓練することができます。精度スコア(%)が悪い(<50)場合は、データの不整合を確認し、それらを磨き、モデルを再度訓練する必要があります。

精度スコア

予測モデルは、テストデータセットの予測結果を基に、訓練済みモデルの精度スコアを計算します。 例えば、データセットに500レコードがあり、モデルがそのうちの492を正しく予測した場合、精度スコアは96%と表示されます。


  1. AIの技術に関しても、常に完璧な結果を出すことはできません。そのため、モデルの結果を完璧に近づけるため、私たちは常にモデルをトレーニングしています。
  2. モデルの結果は動的です。同じ入力が、機械が学習した程度によって、時々異なる結果を生み出すことがあります。これは、私たちが常にトレーニングを行い、モデルが時々学習していることを意味します。

予測モデルの性能を向上させる

モデルをトレーニング、テスト、評価した後、期待される結果が得られなかった場合は、性能を向上させるために(任意)モデルを編集することができます。正確性スコアを向上させるために試すことができるいくつかのことを以下に示します。

エラーと問題をレビューする

  • モデルの学習が失敗した場合、モデルの詳細を確認し、モデルを再学習してください。
  • エラーがないにも関わらず、精度が低い場合は、モデルの学習の詳細を確認してください。 
  • 可能な限り多くの問題を解決し、その後モデルを再学習してください。 いくつかの問題は、次のような理由で発生する可能性があります。
  • 必須のモデルガイドラインが満たされない場合、または不正確なデータがモデルに入力された場合
  • アプリケーションレコードから訓練データを追加する場合、それぞれの基本フィールドと依存フィールドがフォームに存在しない場合、モデル訓練が失敗する可能性があります。この場合、まずフォームで作成してからモデルを訓練する必要があります。

データベースの変更
  • 最低でも、50から100のデータレコードが必要です。高い予測性を持ち、より高い精度を持つモデルを訓練するには、正しくラベル付けされたレコードが10,000以上必要です。
  • 時には、正しくラベル付けされた訓練データが多くある場合もあります。 しかし、必要な予測を行うために関係のないフィールド/列を選択してしまった場合、モデルがうまく機能しない可能性があります。 予測したいものに影響を与える関連する列を選択し、関係のない列を選択解除してください。
  • データには、予測される可能性のあるオプションの範囲を含めることをお勧めします。例えば、2つの歴史的な結果がある場合:「成功」または「失敗」であり、ほとんどのデータレコードはこの列に「成功」しかない場合、このような不均衡なデータ分布からモデルが学習するのは難しいでしょう。
  • データに欠損値が高い割合がないことを確認してください。欠損値をデフォルトデータで埋めるか、モデルのトレーニングからデータを削除することができます。
  • 予測結果に高い相関があるフィールド/列がある場合は、それを取り除いてモデルを訓練してください。


データクリーニング

データの清掃とは、トレーニングデータセットから正確でない、正しくフォーマットされていない、重複した、または不十分な情報を取り除くプロセスです。2つ以上のデータソースを結合すると、データ重複やラベル付けエラーのリスクが増加します。予測結果が正確に見えても、データの誤りによりそれらが信頼できなくなる可能性があります。


モデルの学習に使用する前に、データをきれいにすることが重要です。タイポや欠落した数字、スペルミスなどのエラーを熟知し、各行のデータをよく見直すことで、不適切なデータを取り除くことができます。これを行うことで、モデルの学習に不適切なデータを取り除くことができます。 

モデルの公開と使用

モデルをトレーニングした後、それを公開してユーザーに利用可能にして予測を開始することができます。詳しくはこちら

モデルを一度しか公開できません。ユーザーがモデルを使用したくない場合は、モデルを削除することができます。

プレディクションモデルを環境対応のCreatorアプリケーションで使用するには、そのアプリケーションのプロダクション環境に少なくとも1つのバージョンが公開されている必要があります。モデルをアプリケーションにデプロイした後、異なる環境のステージ間をフィルターすることができます。モデルがデプロイされているステージを確認します。こちらを参照してください。


サンプルデータで開始する

予測をすぐに始めるのを助けるために、Creatorアプリケーションですぐに使用できるサンプルデータを提供しています。以下の添付ファイルをダウンロードして、予測モデルを作成してください!

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho WorkDrive Resources



                Zoho Desk Resources

                • Desk Community Learning Series


                • Digest


                • Functions


                • Meetups


                • Kbase


                • Resources


                • Glossary


                • Desk Marketplace


                • MVP Corner


                • Word of the Day









                                  • Related Articles

                                  • 「予測フィールドの追加」

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 こちらのページを参照して、予測フィールドについて学習してください:こちら 予測フィールドをフォーム内に追加する前に、予測モデルを作成する必要があります。 1. アプリを編集します。 2. 所要のフォームのビルダーを開きます。 3. ...

                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.