理解OCRモデル

理解OCRモデル

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

AIモデルは大幅な改良を行い、今はAI Modelerとして、モデルを構築、トレーニング、およびアプリ全体で使用するモデルを公開することができます。 この改良前にモデルを作成した場合は、こちらをクリックして詳細をご覧ください。 


Optical Character Recognition(OCR)モデルは、テキスト認識モデルであり、デジタル画像からテキスト(印刷されたものと手書きのもの)を識別して抽出します。 マシンラーニングを使用して、モデルをトレーニングして、デジタル画像をスキャンして必要な情報のみを抽出することができます。 これは、大量の非構造化データから構造化データを処理して取得したい場合に特に便利です。

この構造化されたデータは、必要なときにビジネスが保存および処理することができ、データ入力プロセスを簡素化および自動化するのに役立ちます。 例えば、構造化されたデータは、電子メールの日時であるのに対し、非構造化データは、電子メールの全体の内容自体です。 

Creatorは2つのタイプのOCRモデルをサポートします:ビジネスニーズに合わせたカスタムモデルを構築できますか、または準備ができている(プリビルト)モデルを選択して、多くの一般的なビジネスシナリオでアプリケーションに展開できる準備ができています。

ユーザーはカスタムOCRモデルを構築することができます。このモデルは、必要な値のみを識別して抽出するように訓練することができます。カスタムOCRモデルは、業界をリードするテキスト認識技術のアンサンブルを利用して、カスタムOCRモデルの場合にテキストを識別して強調表示します。モデルによって識別された抽出可能なテキストは、タグ付けされていない値であることを示すために強調表示されます。ユーザーは、画像から値を抽出したいフィールドを追加してタグ付けすることができます。モデルは、画像内に見つかった必要なテキストを抽出して処理するように訓練することができます。 


- OCRモデルは、フォントの種類に関係なく画像からテキストを抽出することができます。 
- モデルは、印刷テキストと手書きテキストの両方を検出することができます。 印刷テキストを使用することをお勧めします。 手書きテキストに関しては、多くの変化がある場合、モデルが必要なテキストを処理するのが難しくなる可能性があります。 

以下のGIFは、入力画像(請求書)から必要なテキスト値を抽出することを示しています:


OCRモデルの前提条件

独自のOCRモデルを構築して訓練し、ビジネスニーズに合わせることができます。さらに、当社の 準備完了-から-OCRモデルを利用することができ、それを直接アプリケーションに展開することができます。


例えば、ある一連の入力画像からテキストを抽出したいとします。その場合、カスタムOCRモデルがより適しています。場合によっては、入力画像から検出されたすべてのテキストを抽出したい場合もあります。そのような場合は、準備が整ったOCRモデルを使用することができます。

必要なスキルは何ですか?

  • 管理者として、OCRモデルを作成・使用できますが、ユーザーは作成したモデルを利用することができます。 
  • モデルをトレーニングするために使用するデータセットを決定するのに十分なビジネス要件を知っている必要があります。
  • Creatorは、事前のコーディングや機械学習ML)スキルがなくても、モデルの作成と消費を行うことができるローコードプラットフォームです。

データが必要なのは何ですか?

  • 訓練データとしてアップロードするには、少なくとも 5枚 の類似レイアウトの画像が必要です。 
  • 画像は異なるレイアウトでも構いませんが、抽出値を正しくタグ付けする必要があります。

どのプライスプランに入る必要がありますか?

  • AIモデルは、プロフェッショナルおよびアルティメットプランのユーザーに利用可能です。詳細は、当社の料金ページをご覧ください。

どのバージョンのCreatorを使用すべきですか?

  • Zoho Creator 6(C6)を使用してカスタムAIモデルを作成する必要がありますが、 準備ができたAIモデルは、C6とC5の両方で利用可能です。

Zylkerの請求書処理アプリをCreatorを使用して構築したと仮定します。フォーム名は「請求書の詳細」で、請求書の詳細とデジタルコピーを追加します。請求書から、請求日、請求書番号、支払期日、請求先住所などのデータを抽出する必要があります。これは、支払いを処理し、口座を管理するために紙の請求書を頼ることで手動で行うことができます。しかし、複数のエントリが関係している場合、抽出プロセスを自動化することで、多くの時間と手動作業を節約できます。


このケースでOCRモデルを使用する方法を以下に示します。


  1. モデルを作成します:
  • 抽出する値を特定し、それぞれの値を格納するためのフィールドとそのフィールドタイプを選択します。ここでは、請求書番号請求書日付期日, および 請求先住所が抽出する値となります。
  • 同じ/異なるレイアウトの足りない画像をアップロードし、定義されたフィールドの値を抽出する必要があります。ここでは、あなたの 請求書の画像をアップロードする必要があります。
  1. モデルを訓練する
  2. モデルをデプロイする:
  • フォーム内の画像フィールドを選択し、モデルの入力を受け付けます。 
  • 先ほど定義したフィールドを追加して、画像フィールドから抽出した値を格納します。ここでは、 請求書番号請求書日付支払期日および 請求先住所が、抽出する値を格納するフィールドとなります(上記GIFを参照)。
  • 必要な値を取得するために、ライブで画像をアップロードします。 この場合の入力は、 請求書の画像となります。

OCRモデルフロー


モデルの設定

トレーニングデータを追加する

訓練データは、モデルがデータパターンを分析し、解釈を行い、画像からテキストを認識するのに役立つ結論に到達するために使用される最初のデータセットです。 OCRモデルを訓練するには、十分な類似したレイアウトの画像を収集する必要があります。次に、収集した画像から抽出したい値を特定する必要があります。訓練データが最終決定したら、OCRモデルにフィールドを追加することができます。


  1. AIにおいても、モデルの結果が常に正確とは限りません。
  2. モデルの結果は動的です。同じ入力でも、機械が学習した量によって、時間によって異なる結果が得られる場合があります。これは、モデルを持続的に再訓練することで、持続的に学習していることを意味します。



フィールドを追加する

Creator では、ユーザーが入力した値がフォームフィールドに格納されます。同様に、抽出したい値はそれぞれのフィールドに表示されます。フィールドの追加は、それらの定義を確立するために使用されます。そのため、モデルがCreatorアプリケーションに実装された場合、これらのフィールドがそのアプリケーションのフォームにリスト表示されます。必要に応じて、定義済みのフィールドを選択/非選択できます。トレーニングデータから抽出する値を特定したので、フィールドとその対応するデータ型を追加する必要があります。


対応しているデータ型は、テキスト数値、および日付です。 

画像を追加する

以前採集した画像が今役立つことになります。これらの画像は、請求書、小切手、請求書、パスポート、領収書などを含む文書の画像です。これらの文書のテキストは、手書きまたは印刷されていますが、印刷テキストが好ましいです。


注意: 手書きと印刷画像の両方をアップロードできます。 すべての画像に正しく抽出値をタグ付けして、モデルが望むように値を正しく抽出できるようにしてください。

タグフィールド

画像をアップロードしたら、アップロードされた画像の各テキストが強調表示されます。次に、先に追加したフィールドにタグ付けする値をすべてのアップロードされた画像に設定する必要があります。ここでのタグ付けとは、追加したフィールドを抽出して表示する必要がある値にマッピングまたは関連付けることを意味します。追加したフィールドのデータ型が数値の場合、画像内の請求書番号の値をタグ付けすることができます。これは、入力データからこれらのフィールド値を抽出する必要があることをOCRモデルが認識するようにするためです。



ガイドライン

フォーマット

  • サポートされているフォーマットには、JPEG、.PNG、.BMP、.TIFが含まれます


サイズ

  • 各アップロード画像の最大サイズは5 MBを超えてはなりません。
  • 全体のモデルサイズは150 MBを超えてはなりません。


言語 (印刷及び手書きテキスト用)

  • 現在、英語のみをサポートしています。


その他

  • 画像をクリアにアップロードしてください。
  • 異なるレイアウトの画像をアップロードする場合は、抽出値を適切にタグ付けしてください。
  • 正確な認識と抽出のために、同じレイアウトの最低5枚の画像をアップロードする必要があります。
  • 最低5枚の画像で、各フィールドをそれぞれの値にタグ付けする必要があります。これにより、トレーニングが成功することができます。
  • 1つのモデルにつき、最低1つのフィールドとそのフィールドタイプ、最大10つのフィールドとそのフィールドタイプを抽出することができます。
  • フォームにOCRフィールドを追加するには、ソースフィールドとして画像が必要です。画像フィールドです。ソースフィールドとは、モデルがテキストを識別および抽出するために入力画像をアップロードするフィールドのことを指します。サポートされているフィールドタイプがフォームにありません場合は、OCRモデルを展開する前に1つ作成する必要があります。 

モデルの概要

訓練データを追加した後、モデルの詳細を確認できます: モデル名、 モデルタイプ訓練データ追加された画像の数などです。修正が必要な場合は、戻って修正を行うことができます。そうでない場合は、モデルを訓練することに進むことができます。 

モデルを訓練する

OCRモデルをアプリケーションで実際に使用する前に、必要な方法で動作させるようにトレーニングする必要があります。トレーニングデータを選択し、レビューした後、モデルをトレーニングするには「トレーニング」をクリックしてください。

注意: トレーニングには時間がかかる場合があるので、同じページを開いたまま待つか、ページを閉じて後で戻ってきてください。トレーニング時間はモデルサイズとキュー内のトレーニングモデルの数によって異なります。

モデルの詳細を表示して管理する

トレーニングモデルが完了したら、モデルの詳細、モデルのバージョン、およびデプロイメントの詳細を表示できます(もしあれば)。モデルは現在、公開およびアプリへのデプロイの準備が整いました。


モデルを以下のような方法で管理することができます:

  • 再学習 - 新しいデータが常に生成されているため、定期的にモデルを再学習することをお勧めします。これにより、OCRモデルの正確性と信頼性を高めることができます。 
  • モデルを再トレーニングすることができます 「モデルの再トレーニング」 をクリックすると、モデルが再トレーニングされます。
  • 各回のトレーニングの終了後、新しいモデルのバージョンが作成されます。必要に応じて、異なるバージョンを切り替えることができます。
  • 現在使用中のバージョンを削除する場合は、削除を実行する前に他のバージョンに切り替える必要があります。 
  • モデルのトレーニングが失敗した場合、「モデルのトレーニングが失敗しました!」と表示されます。一方、以前の有効なモデルが予測に使用されます。 
  • 注意:
    • 「リトレイン」オプションは、フォームフィールドを介してトレーニングデータを追加する場合にのみ利用できます。これは、新しいレコードがアプリケーションに連続的に追加されるにつれてモデルをトレーニングすることができるからです。 
    • CSVファイルを使用してデータを追加する場合は、モデルを削除し、新しいファイルをアップロードし、モデルを再度トレーニングすることができます。
  • 名前変更 - 必要に応じてモデルの名前を変更できます。
  • 削除 - 不整合または間違って追加されたデータの場合、「削除」オプションを使用してモデルを削除できます。

テストモデル

模型を公開してアプリケーションに展開する前に、テストすることを推奨します(必須ではありません)。 
トレーニングを終えて公開する前に、モデルをテストしてどのようにモデルが動作するかを確認し、トレーニングが満足に行われているかを確認することができます。テストデータをアップロードし、モデルをテスト後、抽出された値が結果として得られます。 
  1. 期待した結果が得られない場合は、モデルを再トレーニングするか、モデルの詳細を編集して再度トレーニングすることができます。再トレーニングとは、モデルが継続的に学習しているため、単にモデルを再度トレーニングすることを指します。 
  2. モデルをテストする際には、一度に1枚の画像のみをアップロードできます。 
  3. OCRモデルのガイドラインについては、こちらをクリックしてください。

OCRモデルの性能を向上させる

モデルを訓練し、テストし、評価した後、モデルを調整して性能を向上させることができます。以下に、モデルの性能を改善するために試すことができるいくつかのことを紹介します。

  • 画像を収集する際は、モデルがテキストを簡単に認識できるように、文字がきちんと整列していることを確認してください。
  • 高品質の画像を収集し、アップロードするようにしてください。元の画像の品質が高いほど、文字を他のものから分離するのが容易になり、OCRモデルの正確性も高くなります。
  • テキストと背景のコントラストを高めることで、出力の明瞭度を高めることができます。 
  • 印刷されたテキストを用いた場合、OCRエンジンの精度は高いです。
  • 画像が上下逆さまにならないように注意してください。正しい形式で画像を取得し、テキストが傾いていない水平な状態になるようにしてください。 

公開モデル

モデルをトレーニングした後、ユーザーに利用可能にして予測を開始するために公開することができます。方法を学ぶ

モデルを一度だけ公開できます。ユーザーがモデルを使用したくない場合は、モデルを削除することができます。

OCRモデルを環境対応のCreatorアプリケーションで使用するには、そのアプリケーションの最低1つのバージョンをプロダクション環境に公開する必要があります。モデルをアプリケーションにデプロイした後、異なる環境のステージをフィルタリングして、どのステージにモデルがデプロイされているかを確認できます。 モデルのデプロイ方法を学ぶ

モデルの使用

モデルを公開した後、アプリケーションとデプロイするフォームを選択する必要があります。選択したフォームにリダイレクトされ、以前に定義したフィールドがフォームビルダーにリストされます。必要に応じてフィールドを選択/非選択できます。非選択されたフィールドはそのフォームに追加されません。例えば、同じOCRモデルを2つのフォームで使用する場合、2つのフォームに必要なフィールドが同じではない場合、必要なもの以外を非選択できます。 

新しいOCRフィールドがフォームに追加されます。ここでは、好きな画像をアップロードできます。OCRモデルは、定義されたフィールドに抽出された値を分析して表示します。

サンプルデータで開始する

OCRをすばやく開始するために、Creatorアプリケーションですぐに使用できるサンプルデータを提供しています。下をスクロールして添付ファイルをダウンロードできます。

    Zoho CRM 管理者向けトレーニング

    「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。

    日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。

    Zoho CRM Training



              Zoho WorkDrive Resources



                Zoho Desk Resources

                • Desk Community Learning Series


                • Digest


                • Functions


                • Meetups


                • Kbase


                • Resources


                • Glossary


                • Desk Marketplace


                • MVP Corner


                • Word of the Day









                                • Related Articles

                                • 「OCRモデルを構築して管理する」

                                  お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。 AIモデルは大きな改良を経て、今はAI Modelerとして、モデルを構築、訓練、およびアプリ全体で使用できるように公開できるようになりました。 この改良前にモデルを作成した場合は、こちらをクリックして詳細をご覧ください。 このページでは、次のことを見ていきます: OCRモデルの作成 ...

                                Resources

                                Videos

                                Watch comprehensive videos on features and other important topics that will help you master Zoho CRM.



                                eBooks

                                Download free eBooks and access a range of topics to get deeper insight on successfully using Zoho CRM.



                                Webinars

                                Sign up for our webinars and learn the Zoho CRM basics, from customization to sales force automation and more.



                                CRM Tips

                                Make the most of Zoho CRM with these useful tips.