OCRモデルの作成と管理

OCRモデルの作成と管理

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Info
AI モデルがメジャーアップデートされ、名称がAI Modeler に変更されました。これにより、アプリ全体で使用するモデルを作成、トレーニング、公開できるようになりました。今回のアップデート以前にモデルを作成している場合は、こちらをクリックして詳細をご確認ください。

本記事では、次の内容を説明します。

  1. OCR モデルを作成する

i) モデルをトレーニング - カスタムモデルをトレーニングします

ii) モデルをテスト - モデルの精度をテストします

  1. OCR モデルを管理する

i) モデルを公開する

モデルを使用する - アプリケーションにモデルをデプロイします


  • Optical Character Recognition (OCR) モデルは、デジタル画像PDFから情報を識別して抽出します。詳細は OCR モデルについて ページを参照してください。
  • 自社のニーズに合わせて OCR モデルを作成 することも、すぐに使用できるモデル を選択して、アプリケーションに直接デプロイすることもできます。


OCR モデルを設定するには、次の 4 つの手順に従います。

手順 1: OCR モデルを作成する

手順 2: トレーニングデータを追加する

手順 3: モデル概要を確認し、モデルをトレーニングおよびテストする

手順 4: モデルを公開して使用する

手順 1: OCR モデルを作成する

  1. Creator のDEVELOP セクションにあるMicroservices に移動します。ホームページからアクセスできます。ここに、すべてのマイクロサービス が一覧表示されます。


  1. OCR モデルを作成するには、次の操作を行います。
  • 初めて AI モデルを作成する場合は、+ 新規作成 ボタンをMicroservices ページ中央でクリックします。
  • すでに AI モデルを作成済みの場合は、+ 新規作成 ボタンをMicroservices ページ右上でクリックします。


  1. AI Models セクションで作成ボタンをクリックします。 AI Modelsホームページには 2 種類のモデルがあります。ユーザーのニーズに応じて構築できるカスタムモデルと、すぐにアプリケーションにデプロイできるReady-To-Useモデルです。
    Notesメモ: カスタム OCR モデルと Ready-To-Use OCR モデルの両方を作成できます。モデルタイプの詳細についてはこちらを参照してください。


  1. AI Modeler ページの Create - Custom Models セクションで、OCRカードをクリックします。
  2. モデル名を入力し、モデルのトレーニングに使用するトレーニングデータ (受取請求書小切手フォーム請求書など) の種類を、表示されるドロップダウンメニューから選択します。 [Other ] オプションを選択した場合は、アップロードする画像の種類を指定する必要があります。
    Notesメモ: モデル名は 30 文字以内である必要があります。

     
  3. [Create Model] をクリックします。すると、項目の追加画面が開きます。

手順 2: トレーニングデータを追加する

トレーニングデータはモデルを学習させるための主なデータセットであり、入力情報を正しく認識し、提供された情報に基づいて正確に判断できるようにします。これにより、モデルが意図したとおりに動作することが保証されます。OCRモデルの場合、同じレイアウトの画像または PDF を複数追加し、そこから抽出する値にタグ付けする必要があります。これにより、モデルは追加されたトレーニングデータからどの値を抽出する必要があるかを認識できます。詳細については、ガイドライン セクションを参照してください。

項目とデータ型を追加する

  1. 項目の追加画面で、抽出したい値の項目名を入力し、該当するデータの種類テキスト数値日付)を選択します。
メモ:
  1. 項目を追加するのは、あらかじめ定義しておくことで、モデルを Creator アプリケーションに実装した際に、これらの項目がそのアプリケーションのフォームに一覧表示されるようにするためです。
  2. 項目名は 30 文字以内である必要があります。
  1. その他の抽出項目とその項目タイプを同様に定義するには、+ 項目を追加をクリックします。必要なデータの追加が完了したら、下部の次へをクリックします。

Notes
メモ: 1 つの OCR モデルにつき、最小 1 項目、最大 10 項目まで追加できます。

画像または PDF を追加する

1. トレーニングデータとして PDF か画像を選択します。

2. 選択したオプションに応じて、PDF をアップロードまたは画像をアップロードをクリックします。
Notes
メモ:
  1. 正しく画像認識を行うには、同じレイアウトの5 枚以上の画像をアップロードする必要があります。
  2. カスタム OCR モデルの場合は、2 ページ構成のPDF を 5 ファイル以上用意する必要があります。
  3. トレーニングデータが画像ベースか PDF ベースかに応じて、1 モデルあたり同じレイアウトの画像を最大 20 枚、またはPDF を最大 10 ファイルまで追加できます。
  4. 対応している画像形式は、JPGPNGTIFです。
  5. その他のガイドラインについては、こちらをクリックしてください。
1 つ以上の画像/PDF をアップロードしたら、そのいずれかをクリックしてプレビューを表示します。プレビューポップアップでは、拡大縮小幅に合わせるページに合わせる、前の画像/PDF への移動、次の画像/PDF への移動ができます。
3. 右上の[トレーニングデータを追加]をクリックして、必要に応じてさらに画像や PDF をアップロードします。複数の画像や PDF を一度にアップロードできます。

4. アップロード済みのトレーニングデータを削除するには、[すべて選択]を選んで[削除]をクリックするか、個別の画像/PDF を選択して[削除]をクリックします。

項目のタグ付け

項目を追加し、必要な画像や PDF をアップロードしたら、アップロードした各トレーニングデータ内で、追加した項目を対応する値にタグ付けする必要があります。これにより、モデルがどの値をトレーニングデータから抽出すべきかを参照・識別できるようになります。トレーニングデータから抽出可能なデータはすべてハイライト表示されます。ここから、自社のニーズに合わせて抽出したい特定のテキスト部分を選択できます。


  1. 画像または PDF ページ内の項目値をクリックし、対応する項目にタグ付けします。タグ付けしたい値全体をクリックしてドラッグする必要があります。


  1. [次をタグ付け] をクリックし、他のアップロード済み画像でも同じ手順を繰り返します。

メモ:

  • 項目の追加を忘れていた場合は、[項目]セクションの下にある[+ 新しい項目を追加]をクリックすることで、[項目を追加]ページに戻らずに項目を追加できます。

  • 項目名の横にある三点リーダー(…)をクリックすると、項目の編集/削除や、誤って追加した項目値の削除が行えます。

  1. マッピングが完了したら、次へ をクリックします。すると、モデル概要ページが開きます。
    Notesメモ : 追加したすべての項目を、すべての画像でタグ付けしていない場合は、先に進むことはできません。.

手順 3: モデル概要を確認し、モデルをトレーニングおよびテストする

トレーニングデータを追加したら、モデル名モデルの種類、トレーニングデータの種類、追加したトレーニングデータの 件数画像またはPDF など、モデルの詳細を確認できます。変更が必要な場合は、戻って編集してください。問題なければ、そのままモデルのトレーニングを続行できます。

モデルのトレーニング

アプリケーションで OCR モデルを実際に使用する前に、目的どおりに動作するようトレーニングする必要があります。


  1. モデル概要ページでモデルの詳細を確認し、必要に応じて[戻る]から変更します。モデル名、トレーニングデータの種類の変更、トレーニングデータの追加アップロード、不要なデータの削除ができます。
  1. 必要な変更が完了したら、Train Model をクリックします。
    Notes
    メモ: モデルのトレーニングには時間がかかる場合があります。ページを開いたまま待機するか、ページを閉じて後で戻ることもできます。

モデルの詳細を表示・管理する

トレーニングが完了すると、ユーザーはモデルのステータス(トレーニング済み失敗下書き)、モデルの種類、作成日と更新日、その他の詳細を確認できます。


Info
  1. OCR モデルを作成してトレーニングを行う前にページを終了した場合、モデルのステータスは「下書き」に設定されます。
  2. モデルのトレーニングは、データ不足やネットワーク障害により失敗する場合があります。


モデルの詳細

このセクションでは、モデルの現在のバージョン、学習データの種類、および値を抽出する必要がある項目名を確認できます。

バージョンの詳細

このセクションでは、モデルが保持しているバージョン数、現在実行中のバージョン、モデルの作成日、追加された項目数、および学習データの件数を確認できます。

Notes
メモ: モデルの新しいバージョンの作成方法については、こちらをクリックしてください。

モデルのデプロイ

このセクションでは、モデルがデプロイされているアプリ名フォーム名、および項目名を確認できます。また、異なる環境でフィルタリングして、モデルがどの環境にデプロイされているかを確認することもできます。




モデルのテスト

学習後に、アプリケーションへデプロイする前にモデルの信頼性をテストできます。これにより、モデルが必要な値を正しく識別・抽出できているかを確認できます。


  1. モデルの学習が正常に完了した後に表示されるページの右上にある[モデルをテスト]をクリックします。


  1. モデルをテスト画面で画像またはPDFをアップロードします。モデルは、右側のModel Outputの下に抽出された値を表示しようとします。
    1. メモ:
      1. 値を抽出する際の重要な条件は、タグ付けされた値とともに追加した項目の位置です。詳細はこちらを参照してください。
      2. レイアウトが少しずつ異なる画像でモデルを学習させており、そのいずれかのレイアウトに該当するテスト画像をアップロードした場合、値は正しく抽出されます。
      3. レイアウトが少しずつ異なる画像でモデルを学習させていても、アップロードしたテスト画像がそれらのレイアウトのいずれにも該当しない、つまり別の画像であるか、値を抽出したい項目の位置が異なる場合、値は正しく抽出されません。同様のことはPDFにも当てはまります。
      4. モデルの出力を改善するには、モデルを再学習するか、モデルの詳細を編集して再度学習させることができます。


OCRモデルの管理

モデルを学習した後は、アプリケーションでデプロイできるように公開する必要があります。公開後、ユーザーはモデルを利用して画像から値の抽出を開始できます。

Notesメモ: 一度公開したモデルは非公開に戻すことはできません。ただし、モデルを変更して再度学習させることは可能です。

モデルを再学習する

類似またはレイアウトが少し異なる画像PDFを追加してモデルを再学習することで、必要な値をより正確に識別・抽出できるようになります。モデルの効率を再調整することで、自社の業務ニーズに合わせてモデルを最適化できます。

Notes
メモ: OCRモデルの信頼性と精度を向上させるため、定期的にモデルを再学習することをおすすめします。


  1. ページ右上の 三点リーダー をクリックします。

  2. Retrain をクリックして、モデルを再トレーニングします。新しいバージョンが作成され、バージョン詳細に一覧表示されます。
  3. 編集 をクリックして、モデルを変更します。ここでは、モデル名の変更、項目とそのデータ型の変更、トレーニングデータの追加/削除、タグ付けされた値の変更などが行えます。これらの変更を反映するには、モデルを再トレーニング する必要があります。
  4. 名前を変更する をクリックして、モデル名を変更します。ポップアップが表示されるので、そこでモデル名を編集し、名前を変更するをクリックします。
  5. 削除 をクリックして、モデルを削除します。
メモ:
  1. いずれかのアプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
  2. 削除後も、追加された項目(モデルの入力項目と出力項目)は、該当モデルがデプロイされているフォーム内に残ります。OCRモデルから取得された過去のデータは、該当項目がフォームから削除されない限り保持されます。
  3. 現在使用中のモデルバージョンは削除できません。別のバージョンに切り替えてから、そのモデルバージョンを削除してください。

手順 4: モデルを公開して使用する

モデルをトレーニングしてテストしたら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後、モデルはアプリケーション内でユーザーにより使用できます。 Iユーザーにモデルを使用させたくない場合は、モデルを削除できます。


  1. 公開 Model を右上でクリックします。
  2. 公開 を、画面に表示される公開 ポップアップでクリックします。


モデルを使用する

  1. モデルが公開されると、表示されるポップアップまたはページ右上から、使用する Model をクリックできます。
  2. 表示される「使用する Model」ポップアップで、アプリケーション名とフォーム名をドロップダウンリストから選択し、使用する Modelをクリックします。

    ユーザーは、選択したアプリケーションのフォームビルダーにリダイレクトされ、そこでモデルがデプロイされます。
    OCRポップアップが表示され、Model Input 画面が開きます。
    Notesメモ : トレーニング済みで選択したモデルは、「モデルを選択」セクションですでに選択された状態になっています。すぐに使える OCR モデルを作成する際に、モデルを選択することもできます。
  1. Model Input セクションで、ドロップダウンメニューからデータ元項目を選択し、次へをクリックします。
メモ :
  1. 現在、データ元項目として追加できるのは、画像項目とファイルアップロード項目のみです。そのため、フォーム内で利用可能な画像またはファイルアップロード型の項目だけが、データ元項目として一覧表示されます。
  2. 選択したフォームに画像またはファイルアップロード項目がない場合は、まずその項目を作成してから、OCRモデルをデプロイする必要があります。
  1. 抽出された項目項目の種類 が正しく選択されていることを確認します。初期設定では、定義されたすべての項目が選択され、作成されます。必要に応じて選択を解除できます。
メモ :
  1. 「抽出された項目」とは、アプリの実行画面で抽出された値が表示される項目を指します。
  2. 項目の種類として「数値」を選択した場合、小数、パーセンテージ(%)、通貨項目の値が含まれます。
  3. 項目の種類として「テキスト」を選択した場合、1 行テキストおよび複数行テキスト項目の値が含まれます。
  4. 項目の種類として「日付」を選択した場合、選択した形式の日付値のみが表示されます。
  1. [項目を追加] をクリックします。新しい OCR 項目が作成されます。


これでアプリにアクセスし、有効化された OCR を使用して、データ元 項目に必要な画像または PDF をアップロードできます。OCR 項目はアップロードされた入力内容を認識し、抽出された値は抽出結果項目に表示されます。


以下の動画は、入力画像項目からアップロードされた画像からテキストを抽出する様子を示しています。


関連トピック

  1. AI モデラーについて
  2. OCR モデルについて

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho Campaigns Resources

                Zoho WorkDrive Resources




                  • Desk Community Learning Series


                  • Digest


                  • Functions


                  • Meetups


                  • Kbase


                  • Resources


                  • Glossary


                  • Desk Marketplace


                  • MVP Corner


                  • Word of the Day


                  • Ask the Experts









                                  • Related Articles

                                  • OCRモデルの概要

                                    お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 AIモデルが大幅に刷新され、名称がAI Modeler に変更されました。これにより、アプリ全体で使用するモデルを作成・トレーニング・公開できるようになりました。今回の刷新以前にモデルを作成している場合は、こちらをクリックして詳細をご確認ください。 Optical Character ...

                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.