OCRモデルの作成と管理

OCRモデルの作成と管理

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Info
AI モデルは大幅に刷新され、名称が AI Modeler に変更されました。AI Modeler を使用すると、アプリ全体で利用できるモデルを作成・トレーニング・公開できます。今回の刷新以前にモデルを作成している場合は、詳細についてこちらをご覧ください。
Notes
メモ:
Creator アプリケーション内で AI モデルが実行されるたびに、AI コールが消費されます。OCR 項目については、次のとおりです。
  1. 元の項目に入力値が入力されると、OCR 項目に出力を生成するための AI コールがトリガーされます。この AI コールは、利用中のAI コール上限数およびCreator プランから差し引かれます。
  2. 出力の生成前後を問わず、元の項目が変更されると、更新された入力値を使用してモデルが再度実行されます。このとき追加の AI コールが発生し、これもAI コール上限数にカウントされます。
残りの AI コール上限数は、請求セクションから確認できます。

目次: 以下の内容を説明します。

  1. OCR モデルの構築

i) モデルのトレーニング - カスタムモデルをトレーニングします

ii) モデルのテスト - モデルの精度と動作をテストします

  1. OCR モデルの管理

i) モデルの公開

モデルの利用 - アプリケーションにモデルをデプロイします


  • Optical Character Recognition (OCR)モデルは、デジタル画像PDFから情報を検出して抽出します。詳細は、OCR モデルについて のページをご覧ください。
  • ビジネスニーズに合わせてOCR モデルを構築 することも、すぐに使えるモデル を選択して、アプリケーションに直接デプロイすることもできます。


OCR モデルを設定するには、次の 4 ステップを実行します。

ステップ 1: OCR モデルを作成する

ステップ 2: トレーニングデータを追加する

ステップ 3: モデルサマリーの確認、トレーニングとテスト

ステップ 4: モデルの公開と利用

ステップ 1: OCR モデルを作成する

  1. Creator のホームページで、DEVELOP セクション内の Microservices に移動します。すべてのマイクロサービス がここに一覧表示されます。


  1. OCR モデルを作成するには:
  • 初めて AI モデルを作成する場合は、+ Create New ボタンをMicroservices ページ中央でクリックします。
  • すでに AI モデルを作成済みの場合は、+ Create New ボタンをMicroservices ページ右上でクリックします。


  1. [AI Models]の下にあるCreate ボタンをクリックします。AI Models ホームページには、2 種類のモデルがあります。ユーザーのニーズに応じて構築できるCustom モデルと、すぐにアプリケーションにデプロイできるReady-To-Useモデルです。
    Notesメモ : カスタム OCR モデルと、すぐに利用できる OCR モデルの両方を作成できます。モデルタイプの詳細についてはこちらを参照してください。


  1. AI ModelerページのBuild-Custom Models セクションで、OCR カードをクリックします。
  2. Model Name を入力し、モデルのトレーニングに使用するTraining Data (BillsChequeFormsInvoices など) の種類を、表示されるドロップダウンメニューから選択します。Other ]オプションを選択した場合は、アップロードする画像の種類を指定する必要があります。
    Notesメモ : モデル名は30 文字 以内である必要があります。

     
  3. Create Modelをクリックします。Add 項目 画面が開きます。

ステップ 2: トレーニングデータを追加する

トレーニングデータは、モデルを学習させるために使用される主要なデータセットです。これにより、モデルは入力情報を正しく認識し、与えられた情報に基づいて正確な判断を行えるようになります。これによって、モデルが意図したとおりに動作することが保証されます。OCR モデルの場合、同じレイアウトの画像または PDF のセットを追加し、そこから抽出する値にタグ付けする必要があります。これにより、モデルは追加されたトレーニングデータからどの値を抽出する必要があるかを認識できます。詳細については、ガイドライン セクションを参照してください。

フィールドとデータ型を追加する

  1. Add 項目 画面で、値を抽出したいフィールドの項目 Name を入力し、該当するData Type TextNumber、または Date)を選択します。
メモ:
  1. フィールドを追加することで、事前に定義しておき、モデルを Creator アプリケーションに実装した際に、そのアプリケーションのフォームにこれらのフィールドが表示されるようにします。
  2. 項目名は 30 文字以内である必要があります。
  1. 同様の手順で、さらに抽出フィールドとそのフィールドタイプを定義するには、+ 項目を追加をクリックします。必要なデータの追加が完了したら、画面下部の次へ をクリックします。

Notes
メモ: 1つのOCRモデルにつき、最低1件、最大10件までフィールドを追加できます。

画像またはPDFを追加する

1. トレーニングデータとして、PDFまたは画像を選択します。

2. 選択したオプションに応じて、PDFをアップロードまたは画像をアップロードをクリックします。
Notes
メモ:
  1. 正確に画像認識を行うには、同一レイアウトの画像を最低5枚アップロードする必要があります。
  2. カスタムOCRモデルの場合、2ページ構成のPDFを5件以上アップロードする必要があります。
  3. トレーニングデータが画像ベースかPDFベースかに応じて、1モデルあたり同一レイアウトの最大20枚の画像または最大10件のPDFを追加できます。
  4. 対応している画像形式はJPGPNGTIFです。
  5. 詳細なガイドラインについては、こちらをクリックしてください。
1つ以上の画像/PDFをアップロードしたら、いずれかをクリックしてプレビューを表示します。プレビュー画面では、拡大縮小幅に合わせるページに合わせる、前後の画像/PDFへの移動ができます。
3. さらに画像やPDFをアップロードする必要がある場合は、右上のトレーニングデータを追加をクリックします。複数の画像やPDFを一度にアップロードできます。

4. アップロード済みのトレーニングデータを削除するには、すべて選択を選んで削除をクリックするか、個別の画像/PDFを選択して削除をクリックします。 

フィールドをタグ付けする

フィールドを追加し、必要な画像やPDFをアップロードしたら、アップロードした各トレーニングデータ内の該当する値に、追加したフィールドをタグ付けする必要があります。これにより、モデルはトレーニングデータからどの値を抽出すべきかを学習・識別できます。トレーニングデータから抽出可能なデータはすべてハイライト表示されます。ビジネス要件に応じて、抽出したい特定のテキスト部分を選択できます。


  1. 画像またはPDFページ内のフィールド値をクリックし、対応するフィールドにタグ付けします。タグ付けする値全体をクリックしてドラッグする必要があります。


  1. すべてのアップロード済み画像で前の手順を繰り返すには、次をタグ付け をクリックします。

メモ:

  • フィールドの追加を忘れた場合は、フィールドセクション(右側)で+ 新しい項目を追加をクリックすることで、フィールドを追加ページに戻らずに追加できます。

  • 誤ってフィールドを追加した場合は、項目名の横にある三点リーダー(…)をクリックして、その項目を編集/削除したり、項目値を削除したりできます。

  1. マッピングが完了したら、次へ をクリックします。すると、モデルサマリーページが開きます。
    Notesメモ : 追加したすべてのフィールドを、すべての画像でタグ付けしていない場合は、先に進むことはできません

ステップ 3: モデルサマリーの確認、モデルの学習とテスト

トレーニングデータを追加した後、モデル名モデルタイプ、トレーニングデータの種類、および追加された トレーニングデータ数画像またはPDFなど、モデルの詳細を確認できます。 変更が必要な場合は、戻って修正してください。問題なければ、そのままモデルの学習に進みます。

モデルを学習する

OCR モデルをアプリケーションで実際に使用する前に、目的どおりに動作するよう学習させる必要があります。


  1. モデルサマリーページでモデルの詳細を確認し、必要に応じて[戻る]から変更します。モデル名、トレーニングデータの種類の変更、トレーニングデータの追加アップロード、不要なデータの削除ができます。
  1. 必要な変更が完了したら、モデルを学習をクリックします。
    Notes
    メモ : モデルの学習には時間がかかる場合があります。ページにとどまって完了を待つことも、ページを閉じて後で戻ることもできます。

モデルの詳細を表示・管理する

学習が完了すると、ユーザーはモデルのステータス(学習済み失敗下書き)、モデルタイプ、作成日と更新日、その他の詳細を、以下のとおり確認できます。


Info
  1. OCR モデルを作成して学習を行う前にページを終了した場合、モデルのステータスは下書きに設定されます。
  2. モデルの学習は、データ不足やネットワーク障害により失敗することがあります。


モデルの詳細

このセクションでは、現在のモデルのバージョン、学習データの種類、および値を抽出するフィールド名を確認できます。

バージョンの詳細

このセクションでは、モデルのバージョン数、現在実行中のバージョン、モデルの作成日、追加されたフィールド数、および学習データ数を確認できます。

Notes
メモ: モデルの新しいバージョンの作成方法については、こちらをクリックしてください。

モデルのデプロイ

このセクションでは、モデルがデプロイされているアプリ名フォーム名、およびフィールド名を確認できます。また、異なる環境を切り替えて、どの環境にモデルがデプロイされているかを確認できます。




モデルのテスト

学習後、アプリケーションにデプロイする前にモデルの信頼性をテストできます。これにより、モデルが必要な値を正しく識別して抽出できることを確認できます。


  1. モデルの学習が完了した後に表示されるページの右上にあるTest Modelをクリックします。


  1. Test Model画面で、画像またはPDFをアップロードします。モデルは、右側のModel Outputの下に抽出された値を表示しようとします。
    1. メモ :
      1. 値を抽出する際の重要な条件は、タグ付けされた値とともに追加したフィールドの位置です。詳しくはこちらをご覧ください。
      2. レイアウトが少しずつ異なる複数の画像でモデルを学習させており、テスト用にアップロードした画像がそのいずれかのレイアウトに該当する場合、値は正しく抽出されます。
      3. If yレイアウトが少しずつ異なる複数の画像でモデルを学習させていても、テスト用にアップロードした画像がそれらのいずれのレイアウトにも該当しない場合(別の画像である、または値を抽出したいフィールドの位置が異なるなど)、値は正しく抽出されません。同様のことはPDFにも当てはまります。
      4. モデルの出力を改善するには、モデルを再学習するか、モデルの詳細を編集して再度学習させてください。


OCRモデルの管理

モデルを学習した後は、アプリケーションでデプロイできるように公開する必要があります。公開後、ユーザーはモデルを利用して画像から値を抽出できるようになります。

Notesメモ: 一度公開したモデルは、非公開に戻すことはできません。ただし、モデルを変更して再度学習させることは可能です。

モデルを再学習する

類似またはレイアウトが少し異なる追加の画像PDFでモデルを再学習することで、必要な値をより正確に識別・抽出できるようになります。こうしたモデルの精度向上により、ビジネス要件に合わせてモデルを最適化できます。

Notes
メモ: OCRモデルの信頼性と精度を高めるため、定期的にモデルを再学習することをおすすめします。


  1. ページ右上の三点リーダーをクリックします。

  2. Retrain をクリックして、モデルを再学習します。新しいバージョンが作成され、Version Details に一覧表示されます。
  3. Edit をクリックして、モデルを編集します。モデル名の変更、フィールドとそのデータ型の変更、学習データの追加/削除、タグ付けされた値の変更などが行えます。これらの変更内容を反映するには、モデルを再学習 する必要があります。
  4. Rename をクリックして、モデル名を変更します。ポップアップが表示されるので、そこでモデル名を編集し、Rename をクリックします。
  5. 削除 をクリックして、モデルを削除します。
メモ:
  1. いずれかのアプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
  2. 削除後も、追加されたフィールド(モデルの入力フィールドと出力フィールド)は、そのモデルがデプロイされているフォームに残ります。OCRモデルからの過去データは、該当フィールドをフォームから削除しない限り保持されます。
  3. 現在使用中のモデルバージョンは削除できません。代わりに、別のバージョンに切り替えてから、そのモデルバージョンを削除してください。

ステップ 4: モデルを公開して利用する

モデルを学習・テストしたら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後は、アプリケーション内でユーザーがモデルを利用できるようになります。ユーザーにモデルを使わせたくない場合は、モデルを削除できます。


  1. 右上の Publish Model をクリックします。
  2. Publish を、画面に表示される Publish ポップアップ内でクリックします。


モデルを利用する

  1. モデルを公開した後、表示されるポップアップ、またはページ右上から Use Model をクリックできます。
  2. 表示される Use Model ポップアップで、ドロップダウンリストからアプリケーション名とフォーム名を選択し、Use Model をクリックします。

    ユーザーは、選択したアプリケーションのフォームビルダーにリダイレクトされ、そこでモデルがデプロイされます。
    OCR ポップアップが表示され、Model Input 画面が開きます。
    Notesメモ : 学習済みで選択したモデルは、[Select Model] セクションですでに選択された状態になっています。すぐに使える OCR モデル を作成する際に、モデルを選択できます。
  1. Model Input セクションで、ドロップダウンメニューからソースフィールドを選択し、NEXT をクリックします。
メモ :
  1. 現在、ソースフィールドとして追加できるのは、画像フィールドとファイルアップロードフィールドのみです。そのため、フォーム内にある画像フィールドまたはファイルアップロードフィールドだけが、ソースフィールドの選択肢として表示されます。
  2. 選択したフォームに画像フィールドまたはファイルアップロードフィールドがない場合は、OCR モデルをデプロイする前に、まずいずれかのフィールドを作成する必要があります。
  1. Extracted フィールドフィールドタイプ が正しく選択されていることを確認します。デフォルトでは、定義済みのすべてのフィールドが選択され、作成されます。必要に応じて選択を解除できます。
メモ :
  1. Extracted フィールドとは、アプリの本番モードで抽出された値が表示されるフィールドを指します。
  2. フィールドタイプに数値を選択した場合、小数、パーセンテージ、通貨の値も含まれます。
  3. フィールドタイプにテキストを選択した場合、1 行テキストと複数行テキストの値が含まれます。
  4. フィールドタイプに日付を選択した場合、選択した形式に従った日付値のみが表示されます。
  1. [項目を追加] をクリックします。新しい OCR 項目が作成されます。


これでアプリを本番環境で開き、ソース 項目で必要な画像や PDF をアップロードできます。OCR 項目がアップロードされた入力内容の認識を試行し、抽出された値は抽出結果 項目に表示されます。


以下の動画は、入力画像項目からアップロードされた画像からテキストを抽出する様子を示しています。


  1. AI モデラーについて
  2. OCR モデルについて