OCR モデルを設定するには、次の4つの手順に従ってください。
手順 3: modelの概要を確認し、学習およびテストを行う
training dataはモデルを学習させるための主要なデータセットであり、入力情報を正しく解釈し、正確な判断を下すことを可能にします。これにより、モデルが意図した通りに動作することを保証します。OCR モデルでは、同じレイアウトの画像やPDFをセットで追加し、抽出対象の値にタグ付けを行う必要があります。これにより、モデルはtraining dataからどの値を抽出すべきかを認識できます。ガイドラインセクションで詳細をご確認いただけます。
項目を追加し、必須の画像やPDFをアップロードした後、アップロードした各トレーニングデータ内の該当する値に追加した項目をタグ付けする必要があります。これにより、モデルはどの値をトレーニングデータから抽出すべきかを参照・特定できるようになります。トレーニングデータから抽出可能なすべてのデータはハイライト表示されます。法人ニーズに合わせて、抽出したいテキスト部分を選択できます。
メモ:
- 項目の追加を忘れてしまった場合は、項目セクション(右側)で + 追加する 新しい項目 をクリックすることで、追加する 項目 ページへ戻らずに項目を追加できます。
- 項目名の横にある 三点リーダー をクリックすると、項目の編集・削除や、誤って追加した値の削除が行えます。
トレーニングデータを追加した後、Model 名前、Model 種類、トレーニングデータの種類、追加したトレーニングデータの数(画像またはPDF)など、model の詳細を確認できます。修正が必要な場合は、戻って編集できます。問題がなければ、モデルのトレーニングに進んでください。
OCRモデルをアプリケーションで実際に使用する前に、希望する動作を行うようにトレーニングする必要があります。
トレーニングが完了すると、モデルのステータス(trained、失敗、下書き)、モデル種別、作成・更新日、その他の詳細を下記の通り確認できます。
このセクションでは、モデルの現在のバージョン、トレーニングデータの種類、抽出が必要な項目名を確認できます。
このセクションでは、モデルが持つバージョンの数、現在稼働しているバージョン、モデル作成日、追加された項目数、学習済みデータの件数を確認できます。
このセクションでは、できることとして、モデルがデプロイされているアプリ名、フォーム名、および項目名を表示できます。できることとして、さらにフィルターを使用して、異なる環境の中で、どの環境にモデルがデプロイされているかを確認できます。
トレーニングが完了した後、モデルを本番環境のアプリケーションにデプロイする前に、モデルの信頼性をテストできます。これにより、モデルが必須の値を正確に識別・抽出できることを確認できます。
モデルのトレーニングが完了したら、アプリケーションで利用できるよう公開する必要があります。ユーザーはモデルを利用し、画像から値の抽出を開始できます。
追加の画像やPDF(類似またはレイアウトがやや異なるもの)でモデルを再学習させることで、必須の値やその他の情報をより正確に特定・抽出できるようになります。このような再調整により、モデルの効率が向上し、法人のニーズに合わせて最適化できます。
メモ:
- アプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
- 削除後も、追加された項目(model input および output 項目)は、該当モデルがデプロイされているフォーム内に残ります。OCRモデルからの過去データも、該当項目がフォームから削除されない限り保持されます。
- 現在使用中のモデルのバージョンは削除できません。代わりにバージョンを切り替えてから、そのバージョンを削除することができます。
モデルのトレーニングおよびテストが完了したら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後は、アプリケーション内のユーザーがモデルを使用できるようになります。ユーザーにモデルを使用させたくない場合は、モデルを削除することも可能です。
メモ :
- 現在、画像項目およびファイルアップロード項目のみをデータ元項目として追加できます。そのため、フォーム内で利用可能な画像またはファイルアップロードタイプの項目のみがデータ元項目の選択肢として表示されます。
- 選択したフォームに画像またはファイルアップロード項目がない場合は、OCRモデルを展開する前に作成する必要があります。
メモ :
- Extracted 項目とは、抽出された値がアプリの有効な方法で表示される項目を指します。
- 項目種類に番号を選択した場合、小数、割合(%)、通貨項目の値が対象となります。
- 項目種類にテキストを選択した場合、単一折れ線グラフおよび複数折れ線グラフ項目の値が対象となります。
- 項目種類に日付を選択した場合、選択した形式に従った日付の値のみが表示されます。
これでアプリを有効にして、必須画像またはPDFをデータ元項目にアップロードできます。OCR 項目がアップロードされた入力内容の識別を試み、抽出された値はextracted 項目に表示されます。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。