OCRモデルの構築と管理

OCRモデルの構築と管理

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Info
AI Modelsはメジャーアップデートにより刷新され、AI Modelerに名称変更されました。これにより、モデルの作成、トレーニング、公開を行い、アプリ全体で使用できるようになりました。アップデート前に作成したモデルについては、こちらをクリックして詳細をご確認ください。

目次:本ガイドでは以下の内容を解説します。

  1. OCRモデルの作成

i) モデルの学習 - カスタムモデルを学習させます

ii) テスト Model - モデルのパフォーマンスをテストします

  1. 管理 OCR Model

i) 公開 Model

使用するモデル - モデルをアプリケーションにデプロイする


  • Optical Character Recognition (OCR)モデルは、digital画像やPDFから情報を識別し抽出します。詳細はOCRモデルについて のページをご参照ください。
  • OCRモデルを作成 し、法人のニーズに合わせてカスタマイズすることも、すぐに使えるモデル を選択して、アプリケーションに直接デプロイすることも可能です。


OCRモデルを設定するには、以下の4つのステップに従ってください。

手順1:OCRモデルの作成

手順2:トレーニングデータの追加

手順 3: モデルの概要を確認し、トレーニングおよびテストを実施

手順 4: モデルの公開と利用

手順 1: OCRモデルの作成

  1. Creatorのホームページの「DEVELOP」セクション内のMicroservicesに移動します。 マイクロサービスが一覧表示されます。


  1. OCRモデルを作成するには:
  • 初めてAIモデルを作成する場合は、+ 作成 新規ボタンをMicroservicesページ中央でクリックしてください。
  • すでにAIモデルを作成済みの場合は、+ 作成 新規ボタンをMicroservicesページ右上でクリックしてください。


  1. AI Modelsの下にある作成ボタンをクリックします。AI Modelsホームページには2種類のモデルがあります:カスタムモデルはユーザーのニーズに合わせて構築でき、Ready-To-使用するモデルはアプリケーションに今すぐ導入できます。
    Notesメモ: カスタムおよびReady-To-使用するOCRモデルの両方を作成できます。モデルタイプの詳細については、こちらをご参照ください。


  1. AI Modelerページの作成-カスタム Modelsセクションで、OCRカードをクリックします。
  2. Model 名前を入力し、種類を選択します。Training Data (受取請求書小切手Forms請求書など) を、指定されたドロップダウンメニューからモデルの学習に使用するものとして選択してください。「Other 」オプションを選択した場合は、アップロードする画像の種類を指定する必要があります。
    Notesメモ:Model 名前は30文字以内で入力してください。

     
  3. 作成 Model」をクリックします。追加する 項目画面が開きます。

手順 2: training data の追加

Training data は、モデルを学習させるために使用する主要なデータセットです。これにより、入力情報を正確に認識し、提供された情報に基づいて適切な判断を下せるようになります。これによって、モデルが意図した通りに動作することが保証されます。OCRモデルの場合、同じレイアウトの画像やPDFをセットで追加し、抽出したい値にタグ付けを行う必要があります。これにより、モデルはtraining dataからどの値を抽出すべきかを認識できるようになります。詳細はガイドラインセクションをご確認ください。

追加する 項目とデータ型

  1. 追加する 項目」画面で、抽出したい項目の項目 名前を入力し、該当するデータの種類テキスト番号、または日付)を選択します。
メモ:
  1. 項目の追加は、モデルをCreatorアプリケーションに実装した際に、そのアプリケーションのフォームに項目が一覧表示されるよう、事前に定義するためのものです。
  2. 項目 名前は30文字以内で設定してください。
  1. + 追加する 項目」をクリックして、他の抽出項目やその項目タイプも同様に定義します。必要なデータの追加が完了したら、画面下部の次へをクリックしてください。

Notes
メモ: 1つ以上、最大10個までの項目をOCRモデルごとに追加できます。

追加する 画像 または PDFs

1. トレーニングデータとしてPDFまたは画像を選択します。

2. 選択したオプションに応じて、PDFをアップロード または 画像をアップロード をクリックします。
Notes
メモ:
  1. 正確な画像認識のためには、同じレイアウトの5枚以上の画像をアップロードする必要があります。
  2. カスタムOCRモデルの場合、2ページずつの5つ以上のPDFが必須です。
  3. トレーニングデータが画像ベースかPDFベースかに応じて、1モデルにつき最大20枚の画像または10個のPDFまで追加できます。
  4. 対応画像フォーマットはJPGPNGTIFです。
  5. その他のガイドラインについては、こちらをクリックしてください。
1つ以上の画像やPDFをアップロードした後、いずれかをクリックするとプレビューが表示されます。ズームインズームアウト幅に合わせるページに合わせる、前後の画像やPDFへの移動がプレビューポップアップから可能です。
3. 必要に応じて、右上の トレーニングデータを追加 をクリックして、さらに画像やPDFをアップロードできます。複数の画像やPDFを同時にアップロードすることも可能です。

4. アップロード済みのトレーニングデータを削除するには、すべて選択を選んで削除をクリックするか、個別の画像やPDFを選択して削除をクリックします。

Tag 項目

項目を追加し、必須の画像またはPDFをアップロードした後、アップロードした各トレーニングデータ内の該当する値に追加した項目をタグ付けする必要があります。これにより、モデルが参照し、どの値をトレーニングデータから抽出すべきかを特定できるようになります。トレーニングデータから抽出可能なすべてのデータはハイライト表示されます。必要なテキスト部分のみを選択して抽出することができます。


  1. 画像やPDFページ内の項目値をクリックし、対応する項目にタグ付けします。タグ付けが必要な値を完全にクリック&ドラッグしてください。


  1. 「Tag 次」をクリックし、他のアップロード済み画像でも前述の手順を繰り返します。

メモ:

  • もし項目の追加を忘れた場合は、右側の項目セクション内にある+ 新規項目を追加をクリックすることで、項目を追加ページに戻らずに追加できます。

  • 項目名の横にある三点リーダー(…)をクリックすると、項目の編集・削除や、誤って追加した項目値の削除が可能です。

  1. 「次」をクリックすると、マッピングが完了します。Model 概要ページが開きます。
    Notesメモ : すべての画像内で追加した項目にタグ付けを行っていない場合、これ以上進めません。

手順 3: model 概要を確認し、トレーニングおよびテストを実施

トレーニングデータを追加した後、Model 名前Model 種類トレーニングデータの種類、および追加されたトレーニングデータの数画像またはPDF)など、model の詳細を確認できます。修正が必要な場合は、戻って編集できます。問題なければ、そのままモデルのトレーニングに進めます。

モデルをトレーニングする

OCRモデルをアプリケーションで実際に使用する前に、希望する動作を実現できるようトレーニングする必要があります。


  1. モデル概要ページでモデルの詳細を確認し、必要に応じて戻って修正します。モデル名やトレーニングデータの種類の変更、追加のトレーニングデータのアップロード、不要なデータの削除が可能です。
  1. 必要な変更を加えたら、Train Modelをクリックします。
    Notes
    メモ モデルのトレーニングには時間がかかる場合があります。ページ上でそのまま待つか、ページを閉じて後で戻ることも可能です。

モデル詳細の表示と管理

トレーニングが完了すると、ユーザーはモデルのステータス(trained失敗下書き)、モデル種類、作成日・更新日、その他の詳細を以下の通り確認できます。


Info
  1. OCRモデルを作成し、トレーニング前にページを終了した場合、モデルのステータスは下書きに設定されます。
  2. モデルのトレーニングは、データ不足やネットワーク障害により失敗することがあります。


Model 詳細

このセクションでは、モデルの現在のバージョン、トレーニングデータの種類、および抽出が必要な項目名を表示できます。

バージョン 詳細

このセクションでは、モデルが持つバージョンの数、現在稼働中のバージョン、モデル作成日、追加された項目数、学習済みデータの件数を確認できます。

Notes
メモ: モデルの新規バージョンの作成方法については、こちらをクリックしてください。

Model Deployment

このセクションでは、できることとして、モデルがデプロイされているアプリ名フォーム名、および項目名を表示できます。また、フィルターを使って異なる環境ごとに、どの環境にモデルがデプロイされているかを確認できます。




テスト Model

トレーニング後、アプリケーションにデプロイする前にモデルの信頼性をテストできます。これにより、モデルが必須値を正しく識別・抽出できることを確認できます。


  1. モデルのトレーニングが正常に完了した後に表示されるページの右上にあるテスト Modelをクリックします。


  1. テスト Model 画面で画像またはPDFをアップロードします。モデルは抽出した値を右側のModel Outputの下に表示しようとします。
    1. メモ :
      1. 値を抽出する際の重要な基準は、追加した項目の位置と、それらにタグ付けされた値です。詳細はこちら を参照してください。こちら
      2. レイアウトが多少異なる画像でモデルをトレーニングし、そのいずれかのレイアウトに該当するテスト画像をアップロードした場合、値は正しく抽出されます。
      3. レイアウトが多少異なる画像でモデルをトレーニングし、該当しないレイアウトのテスト画像、つまり異なる画像や、値を抽出したい項目の位置が異なる画像をアップロードした場合、値は正しく抽出されません。PDFも同様です。
      4. モデルの出力を改善するには、モデルを再トレーニングするか、モデル詳細を編集して再度トレーニングしてください。


OCR Modelの管理

モデルのトレーニング後、アプリケーションで利用できるように公開する必要があります。ユーザーはモデルを利用し、画像から値の抽出を開始できます。

Notesメモ : 一度モデルを公開済みにすると、非公開に戻すことはできません。ただし、モデルの変更や再学習は引き続き可能です。

モデルの再学習

追加の画像PDF(類似または多少異なるレイアウト)でモデルを再学習させることで、必須値やその他の情報をより正確に識別・抽出できるようになります。この再調整により、モデルの効率が向上し、法人ごとのニーズに合わせた最適化が可能です。

Notes
メモ: モデルは定期的に再学習することを推奨します。これによりOCRモデルの信頼性や精度が向上します。


  1. ページ右上の三点リーダーをクリックします。

  2. Retrain」をクリックして、モデルを再学習させます。新規バージョンが作成され、「バージョン詳細」に表示されます。
  3. 編集」をクリックして、モデルを編集します。編集内容には、モデル名の変更、項目やデータ型の修正、トレーニングデータの追加・削除、タグ付け値の修正などが含まれます。これらの変更を反映させるには、再度トレーニングが必要です。
  4. 名前を変更する」をクリックして、モデル名を編集します。ポップアップが表示され、モデル名を編集し、「名前を変更する」をクリックしてください。
  5. 削除」をクリックして、モデルを削除します。
メモ:
  1. アプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
  2. 削除後も、追加された項目(モデルの入力項目および出力項目)は、該当モデルがデプロイされているフォーム内に残ります。OCRモデルからの過去データは、該当項目がフォームから削除されない限り保持されます。
  3. 現在使用中のモデルバージョンは削除できません。バージョンを切り替えてから、そのモデルバージョンを削除してください。

手順 4: モデルの公開と利用

モデルのトレーニングとテストが完了したら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後は、アプリケーション内のユーザーがモデルを利用可能です。ユーザーにモデルを利用させたくない場合は、モデルを削除できます。


  1. 画面右上の公開 Modelをクリックします。
  2. 画面に表示される公開ポップアップで公開をクリックします。


使用する Model

  1. モデルが公開済みになると、表示されるポップアップまたはページ右上にある使用する Modelをクリックできます。
  2. 表示された使用する Modelのポップアップで、Application名とフォーム名をドロップダウンリストから選択し、使用する Modelをクリックします。

    ユーザーは、選択したアプリケーションのフォームビルダー画面にリダイレクトされ、モデルがデプロイされます。
    OCRのポップアップが表示され、Model Input画面が開きます。
    Notesメモ : 訓練済みかつ選択済みのモデルは、「選択する Model」セクションですでに選択されています。ready-to-使用する OCR modelを作成する際にもモデルを選択できます。
  1. Model Input 」セクションで、データ元 項目として差出人をドロップダウンメニューから選択し、をクリックします。
メモ :
  1. 現在、画像およびファイルアップロード項目のみをデータ元 項目として追加できます。そのため、フォーム内で利用可能な画像またはファイルアップロード種類の項目のみがデータ元 項目の選択肢として表示されます。
  2. 選択したフォームに画像またはファイルアップロード項目が利用できない場合は、OCRモデルを展開する前に項目を作成する必要があります。
  1. 抽出された項目および項目種類が正しく選択されているかを確認します。初期設定では、定義済みのすべての項目が選択されて作成されます。必要に応じて選択を解除できます。
メモ :
  1. 抽出された項目とは、抽出された値がアプリの有効な方法で表示される項目を指します。
  2. 項目種類として番号を選択した場合、小数、割合(%)、通貨項目の値が含まれます。
  3. 項目種類としてテキストを選択した場合、単一折れ線グラフおよび複数折れ線グラフ項目の値が含まれます。
  4. 項目種類として日付を選択した場合、選択した形式に従った日付値のみが表示されます。
  1. 追加する 項目」をクリックします。新規 OCR 項目が作成されます。


これでアプリにアクセスし、有効化された状態で、データ元項目に必須の画像またはPDFをアップロードできます。OCR 項目はアップロードされた入力内容を識別しようとし、抽出された値はextracted 項目に表示されます。


下記の動画は、入力画像項目を通じてアップロードされた画像から差出人テキストを抽出する様子を示しています。


関連トピック

  1. AI モデラーについて
  2. OCR モデルについて

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho Campaigns Resources

                Zoho WorkDrive Resources




                  • Desk Community Learning Series


                  • Digest


                  • Functions


                  • Meetups


                  • Kbase


                  • Resources


                  • Glossary


                  • Desk Marketplace


                  • MVP Corner


                  • Word of the Day


                  • Ask the Experts









                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.