OCR モデルを設定するには、次の 4 つの手順に従います。
手順 3: モデル概要を確認し、モデルをトレーニングおよびテストする
メモ: カスタム OCR モデルと Ready-To-Use OCR モデルの両方を作成できます。モデルタイプの詳細についてはこちらを参照してください。
メモ: モデル名は 30 文字以内である必要があります。
トレーニングデータはモデルを学習させるための主なデータセットであり、入力情報を正しく認識し、提供された情報に基づいて正確に判断できるようにします。これにより、モデルが意図したとおりに動作することが保証されます。OCRモデルの場合、同じレイアウトの画像または PDF を複数追加し、そこから抽出する値にタグ付けする必要があります。これにより、モデルは追加されたトレーニングデータからどの値を抽出する必要があるかを認識できます。詳細については、ガイドライン セクションを参照してください。
項目を追加し、必要な画像や PDF をアップロードしたら、アップロードした各トレーニングデータ内で、追加した項目を対応する値にタグ付けする必要があります。これにより、モデルがどの値をトレーニングデータから抽出すべきかを参照・識別できるようになります。トレーニングデータから抽出可能なデータはすべてハイライト表示されます。ここから、自社のニーズに合わせて抽出したい特定のテキスト部分を選択できます。
メモ:
- 項目の追加を忘れていた場合は、[項目]セクションの下にある[+ 新しい項目を追加]をクリックすることで、[項目を追加]ページに戻らずに項目を追加できます。
- 項目名の横にある三点リーダー(…)をクリックすると、項目の編集/削除や、誤って追加した項目値の削除が行えます。
メモ : 追加したすべての項目を、すべての画像でタグ付けしていない場合は、先に進むことはできません。.
トレーニングデータを追加したら、モデル名、モデルの種類、トレーニングデータの種類、追加したトレーニングデータの 件数(画像またはPDF) など、モデルの詳細を確認できます。変更が必要な場合は、戻って編集してください。問題なければ、そのままモデルのトレーニングを続行できます。
アプリケーションで OCR モデルを実際に使用する前に、目的どおりに動作するようトレーニングする必要があります。
トレーニングが完了すると、ユーザーはモデルのステータス(トレーニング済み、失敗、下書き)、モデルの種類、作成日と更新日、その他の詳細を確認できます。
このセクションでは、モデルの現在のバージョン、学習データの種類、および値を抽出する必要がある項目名を確認できます。
このセクションでは、モデルが保持しているバージョン数、現在実行中のバージョン、モデルの作成日、追加された項目数、および学習データの件数を確認できます。
このセクションでは、モデルがデプロイされているアプリ名、フォーム名、および項目名を確認できます。また、異なる環境でフィルタリングして、モデルがどの環境にデプロイされているかを確認することもできます。
学習後に、アプリケーションへデプロイする前にモデルの信頼性をテストできます。これにより、モデルが必要な値を正しく識別・抽出できているかを確認できます。
モデルを学習した後は、アプリケーションでデプロイできるように公開する必要があります。公開後、ユーザーはモデルを利用して画像から値の抽出を開始できます。
メモ: 一度公開したモデルは非公開に戻すことはできません。ただし、モデルを変更して再度学習させることは可能です。
類似またはレイアウトが少し異なる画像やPDFを追加してモデルを再学習することで、必要な値をより正確に識別・抽出できるようになります。モデルの効率を再調整することで、自社の業務ニーズに合わせてモデルを最適化できます。
メモ:
- いずれかのアプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
- 削除後も、追加された項目(モデルの入力項目と出力項目)は、該当モデルがデプロイされているフォーム内に残ります。OCRモデルから取得された過去のデータは、該当項目がフォームから削除されない限り保持されます。
- 現在使用中のモデルバージョンは削除できません。別のバージョンに切り替えてから、そのモデルバージョンを削除してください。
モデルをトレーニングしてテストしたら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後、モデルはアプリケーション内でユーザーにより使用できます。 Iユーザーにモデルを使用させたくない場合は、モデルを削除できます。
メモ : トレーニング済みで選択したモデルは、「モデルを選択」セクションですでに選択された状態になっています。すぐに使える OCR モデルを作成する際に、モデルを選択することもできます。
メモ :
- 現在、データ元項目として追加できるのは、画像項目とファイルアップロード項目のみです。そのため、フォーム内で利用可能な画像またはファイルアップロード型の項目だけが、データ元項目として一覧表示されます。
- 選択したフォームに画像またはファイルアップロード項目がない場合は、まずその項目を作成してから、OCRモデルをデプロイする必要があります。
メモ :
- 「抽出された項目」とは、アプリの実行画面で抽出された値が表示される項目を指します。
- 項目の種類として「数値」を選択した場合、小数、パーセンテージ(%)、通貨項目の値が含まれます。
- 項目の種類として「テキスト」を選択した場合、1 行テキストおよび複数行テキスト項目の値が含まれます。
- 項目の種類として「日付」を選択した場合、選択した形式の日付値のみが表示されます。
これでアプリにアクセスし、有効化された OCR を使用して、データ元 項目に必要な画像または PDF をアップロードできます。OCR 項目はアップロードされた入力内容を認識し、抽出された値は抽出結果項目に表示されます。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。