OCRモデルを理解する

OCRモデルを理解する

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

AIモデルはメジャーアップデートにより刷新され、AI Modelerに名称が変更されました。これにより、モデルの作成、トレーニング、公開を行い、アプリ全体で使用できるようになりました。今回のアップデート以前にモデルを作成している場合は、こちらをクリックして詳細をご確認ください。
Optical Character Recognition(OCR)モデルは、テキスト認識モデルであり、デジタル画像やPDFからテキスト(印刷体および手書きの両方)を識別・抽出します。モデルをトレーニングしてデジタル画像またはPDFをスキャンし、機械学習を用いて必要な情報だけを抽出できます。大量の非構造化データから構造化データを取得・処理したい場合に特に有用です。このようにして得られた構造化データは、必要に応じて保存・処理でき、業務のデータ入力プロセスの簡素化や自動化に役立ちます。例えば、構造化データはメールの日付や時刻であり、非構造化データはメール本文全体となります。

Creatorでは2種類のOCRモデルに対応しています。法人のニーズに合わせたカスタムモデルを作成するか、多くの一般的な法人シナリオですぐに導入できる既成(prebuilt)モデルを選択してアプリケーションに展開できます。
カスタムOCRモデルを作成し、必要な値だけを識別・抽出できるようトレーニングすることが可能です。カスタムOCRモデルでは、業界最先端のテキスト認識技術を組み合わせてテキストを識別・強調表示します。モデルによって抽出可能と判断されたすべてのテキストは、タグなし値であることを示すためにハイライトされます。その後、画像から抽出したい項目を追加・タグ付けできます。モデルは画像内の必要なテキストを抽出・処理できるようトレーニングされます。
  1. - OCRモデルは画像からフォントの種類を問わずテキストを抽出できます。
  2. - モデルは印刷体と手書きテキストの両方を検出可能ですが、印刷体のテキスト使用を推奨します。手書きテキストに大きなバラつきがある場合、必要なテキストの処理が困難になる場合があります。




OCRモデルの前提条件

カスタムOCRモデルを作成・トレーニングし、法人のニーズに合わせてご利用いただけます。さらに、既成のOCRモデルを活用し、アプリケーションに直接導入することも可能です。

たとえば、特定の入力画像からテキスト差出人を抽出したい場合、カスタムOCRモデルの方が適しています。一方、入力画像から検出されたすべてのテキスト差出人を抽出したい場合は、既成のOCRモデルを利用できます。これはPDFからテキスト差出人を抽出する場合にも、カスタムおよび既成OCRモデルの両方に当てはまります。

必要なスキルは?

  1. 管理者はOCRモデルを作成および使用できますが、ユーザーはあなたが作成したモデルのみ利用できます。
  2. モデルのトレーニングに使用するデータセットを決定するために、自社の要件を十分に把握しておく必要があります。
  3. 低コードプラットフォームであるCreatorでは、あなたやユーザーが事前にコーディングや機械学習(ml)の知識を持っていなくても、予測モデルの作成や利用が可能です。
メモ : PDFや画像がトレーニングデータの条件を満たさない場合、アップロードできません。

必要なデータは?

画像ベースOCRモデル
  1. 同じレイアウトの画像を少なくとも5枚、トレーニングデータとしてアップロードする必要があります。
  2. 抽出値を正確にタグ付けすれば、異なるレイアウトの画像でも使用できます。
PDFベースOCRモデル
  1. カスタムOCRモデルの場合、同じレイアウトで最大2ページまでのPDFを5つ以上用意し、必要なテキストを抽出する必要があります。

どの料金プランが必要ですか?

  1. AIモデルは、すべての有料プランのユーザーにご利用いただけます。詳細は料金ページをご覧ください。

どのバージョンのCreatorを使用する必要がありますか?

  1. カスタムAIモデルを作成するには、Zoho Creator 6(C6)をご利用ください。既成AIモデルはC6およびC5の両方で利用可能です。


たとえば、Creatorを使ってZylker請求書処理アプリを構築したとします。請求書の詳細というフォームがあり、そこに請求書の詳細とデジタルコピーを登録します。請求日や請求書番号、期限、請求先住所など、請求書から特定のデータを抽出する必要があります。これは紙の請求書をもとに手作業で支払い処理や取引先管理を行うことで完了します。しかし、複数のデータ登録が発生する場合、自動化による抽出プロセスを導入することで、作業時間や手作業を大幅に削減できます。


上記のケースでOCRモデルを使用する手順は以下の通りです:
  1. モデルの作成:
    1. 抽出したい値を特定し、その値を保存するための適切な項目タイプの項目を選択します。ここでは、請求書番号請求日期限請求先住所が抽出対象となります。
    2. 同様または異なるレイアウトの十分なトレーニングデータをアップロードし、値を抽出する必要がある定義済み項目にタグ付けします。この場合、画像またはPDF形式の請求書をアップロードしてください。
  2. モデルのトレーニング
  3. モデルのデプロイ:
    1. モデルの入力となる画像またはファイルアップロード項目をフォームから選択します。
    2. 抽出結果を保存するために、先ほど定義した項目を画像項目から追加します。ここでは、請求書番号請求日期限請求先住所が抽出値を保存する項目となります(上記GIFを参照)。
    3. 必要な値を取得するために、画像またはPDFをアップロードします。この場合の入力は、請求書の画像またはPDFです。

OCRモデルのフロー


モデルのセットアップ

トレーニングデータの追加

トレーニングデータとは、モデルがデータパターンを分析し、解釈を行い、結論を導き出してテキストを認識できるようにするために最初に使用されるデータセットです。OCRモデルをトレーニングするには、同じまたは異なるレイアウトの十分な画像やPDFを収集する必要があります。次に、収集した画像や作成したPDFから抽出したい値を特定します。トレーニングデータが確定したら、引き続きOCRモデルに項目を追加できます。
  1. モデルの結果は常に正確とは限りません。これはあらゆるAIにも当てはまります。
  2. モデルの結果は動的です。同じ入力でも、機械の学習状況によって異なる結果が得られる場合があります。つまり、モデルを継続的に再学習させることで、モデルも継続的に学習しています。
Creator では、フォームの項目にユーザーが入力した値が保存されます。同様に、抽出したい値も該当する項目に表示されます。項目を追加することで、その定義を設定できます。モデルをCreatorアプリケーションに実装した際、これらの項目はアプリケーションのフォームに一覧表示されます。あらかじめ定義された項目を必須として選択・解除することも可能です。抽出すべき値をtraining dataから特定したら、項目と対応するデータ型を追加してください。
サポートされるデータ型にはテキスト番号日付が含まれます。

追加する Training Data

収集した画像や、以前作成したPDFがここで役立ちます。画像やPDFは、写真またはドキュメント(受取請求書、小切手、請求書、パスポート、領収書など)で構いません。これらのドキュメント内のテキストは手書きでも印刷でも対応可能ですが、印刷されたテキストが推奨されます。
メモ : 手書きおよび印刷された画像やPDFの両方をアップロードできます。すべての画像で抽出値に正しくタグ付けを行い、モデルが期待通りに値を識別・抽出できるようにしてください。

Tag 項目

追加したすべての項目にタグ付けした後、必要に応じてここで新しい項目を直接追加できます。「新しい項目を追加」をタグ項目ドロップダウンからクリックしてください。このオプションは、1つのモデルにつき追加された項目が10個未満の場合のみ表示されます。
必要なトレーニングデータをアップロードすると、それぞれのテキストがハイライト表示されます。次に、先ほど追加した項目の値を、アップロード済みのすべての画像/PDFでタグ付けする必要があります。ここでのタグ付けとは、追加した項目を抽出し表示すべき値にマッピングまたは関連付けることを指します。画像/PDFページ内の該当する値を選択してドラッグすることで、値にタグを付けることができます。例として、型が「番号」の請求書番号項目を追加した場合、画像内の請求書番号の値にタグ付けを行う必要があります。これにより、OCRモデルが入力データから抽出すべき項目値として認識できるようになります。


ガイドライン

形式

  1. 対応画像形式は JPEGPNGBMPTIF です。

サイズ

  1. アップロードする各画像の最大サイズは5 MBです。
  2. モデル全体のサイズは150 MBを超えないようにしてください。
  3. アップロードする各PDFの最大サイズは5 MBです。
  4. カスタムOCRモデルの場合、類似レイアウトのPDFは1ファイルにつき最大2ページが必要です。

言語 (印刷および手書きテキストの場合)

  1. 現在サポートされている言語は日本語のみです。

その他

  • クリアな画像をアップロードしてください。
  • 異なるレイアウトの画像をアップロードする場合は、抽出値に正しくタグ付けしてください。
  • 認識と抽出を正確に行うためには、同じレイアウトの画像を最小5枚アップロードする必要があります。
  • 学習を成功させるには、各項目を最小5枚の画像で、それぞれ対応する値にタグ付けする必要があります。
  • 1つのモデルにつき、最小1項目(項目種類付き)、最大10項目(それぞれの項目種類付き)まで抽出可能です。
  • フォームにOCR項目を追加するには、画像項目をそのフォームのデータ元項目として持っている必要があります。データ元項目とは、モデルがテキストを識別・抽出するために入力された画像をアップロードする項目を指します。対応している項目種類がフォーム内に利用可能でない場合は、OCRモデルを導入するために、まず作成する必要があります。

Model 概要

トレーニングデータを追加した後、model 詳細Model 名前Model 種類training data、追加した画像の番号などを確認できます。修正が必要な場合は戻って編集できます。修正が不要な場合は、そのままモデルのトレーニングに進みます。

モデルをトレーニング

OCRモデルを実際にアプリケーションで使用する前に、希望する動作をするようにトレーニングする必要があります。トレーニングデータを選択・確認したら、トレーニングをクリックしてモデルのトレーニングを開始します。

メモ : トレーニングには時間がかかる場合があります。 同じページでそのままお待ちいただくか、ページを閉じて後から戻ることも可能です。トレーニングの所要時間は、モデルのサイズやキュー内のトレーニングモデル数によって異なります。

モデル詳細の表示と管理

モデルのトレーニングが完了すると、モデルの詳細やバージョン、デプロイメントの詳細(存在する場合)を表示できます。モデルは公開やアプリへのデプロイが可能な状態です。


以下の方法でモデルを管理できます。

  • 再トレーニング - 新しいデータが常に作成されるため、定期的にモデルを再トレーニングすることを推奨します。これにより、OCRモデルの信頼性や正確性が向上し、値の抽出精度が高まります。
  • 「Re-train model」をクリックすると、モデルが再学習されます。
  • 各再学習が完了するたびに、新規バージョンのモデルが作成されます。ニーズに応じて異なるバージョン間で切り替えることができます。
  • 現在使用中のバージョンを削除したい場合は、削除する前に別のバージョンへ切り替える必要があります。
  • モデルの学習が失敗した場合、「Model training has 失敗!」と表示されます。その間、前の動作中のモデルが予測に使用されます。
メモ:
  1. 再学習オプションは、フォーム項目からトレーニングデータを追加した場合のみ利用可能です。これは、新規データがアプリケーションに継続的に追加されるたびにモデルをトレーニングできるためです。
  2. CSVファイル経由でデータを追加する場合は、モデルを削除し、新規ファイルをアップロードしてから再度学習できます。
  • 名前を変更する - 必要に応じて、モデルの名前を変更できます。
  • 削除 - データが不整合または誤って追加された場合は、削除オプションを使用してモデルを削除できます。

テスト model

モデルをアプリケーションで公開・展開する前にテストすることを推奨します(必須ではありません)。
トレーニング後から公開前までの間に、モデルの動作やトレーニング結果が満足できるかを確認するためにテストを行うことができます。テストデータをアップロードし、テスト終了後には抽出された値が結果として取得されます。
  1. 期待通りの結果が得られない場合は、モデルを再トレーニングするか、詳細を編集して再度トレーニングしてください。再トレーニングとは、編集せずに再度トレーニングを実施することで、モデルが継続的に学習することを意味します。
  2. モデルのテスト時は、一度にアップロードできる画像は1つのみです。
  3. OCRモデルのガイドラインについては、こちらをクリックしてください。

OCRモデルのパフォーマンスを向上させる方法

モデルのトレーニング、テスト、評価が完了した後は、パフォーマンス向上のためにモデルを調整できます。以下は、モデルのパフォーマンスを高めるために試せるポイントです。
  1. 画像の収集やPDFの作成時には、文字がきちんと整列していることを確認し、モデルがテキストを認識しやすくしましょう。
  2. 高品質な画像やPDFを収集・アップロードするようにしてください。トレーニングデータの元の品質が高いほど文字の判別が容易になり、OCRモデルの精度も向上します。
  3. テキストと背景のコントラストを高めることで、出力の明瞭さをさらに向上させることができます。
  4. 印刷文字に対して使用する場合、OCRエンジンは非常に高い精度を発揮します。
  5. 画像やPDFページが逆さまになっていないことを確認してください。画像は正しい形式で取得し、テキストが水平に表示されていることを確認しましょう。

公開 model

モデルのトレーニングが完了した後、公開してユーザーが利用できるようにし、予測を開始できます。手順はこちら
モデルは一度だけ公開できます。ユーザーにモデルを使用させたくない場合は、モデルを削除できます。
OCRモデルを環境対応のCreatorアプリケーションで使用するには、そのアプリケーションのバージョンが少なくとも1つ、本番環境で公開されている必要があります。アプリケーションにモデルをデプロイした後、環境の各ステージ間でフィルターして、どのステージにデプロイされているかを確認できます。詳細はこちら

使用する model

モデルを公開した後、デプロイ先のアプリケーションとフォームを選択してください。選択したフォームにリダイレクトされ、以前に定義した項目がフォームビルダーに一覧表示されます。項目は必須として選択または選択解除できます。選択解除された項目はそのフォームに追加されません。例えば、同じOCRモデルを2つのフォームで利用する場合、両方のフォームで同じ項目が必要とは限らないため、必要ないものは選択解除できます。
新しいOCR項目がフォームに追加され、お好きな画像をアップロードできます。OCRモデルが解析を行い、抽出した値を定義済みの項目に表示します。
メモ: トレーニング済みモデルを選択する前に、参照がない画像またはファイルアップロード用の項目をフォームに追加してください(つまり、その項目がどこでも使用されていない状態)。

開始する with sample data

OCRをすぐに使い始められるよう、Creatorアプリケーションですぐに利用できるサンプルデータをご用意しています。画面を下にスクロールして添付ファイルをダウンロードしてください。

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho Campaigns Resources

                Zoho WorkDrive Resources




                  • Desk Community Learning Series


                  • Digest


                  • Functions


                  • Meetups


                  • Kbase


                  • Resources


                  • Glossary


                  • Desk Marketplace


                  • MVP Corner


                  • Word of the Day


                  • Ask the Experts









                                  Resources

                                  Videos

                                  Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                  eBooks

                                  Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                  Webinars

                                  Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                  CRM Tips

                                  Make the most of Zoho CRM with these useful tips.