OCRモデルを設定するには、以下の4つのステップに従ってください。
手順 3: モデルの概要を確認し、トレーニングおよびテストを実施
メモ: カスタムおよびReady-To-使用するOCRモデルの両方を作成できます。モデルタイプの詳細については、こちらをご参照ください。
メモ:Model 名前は30文字以内で入力してください。
Training data は、モデルを学習させるために使用する主要なデータセットです。これにより、入力情報を正確に認識し、提供された情報に基づいて適切な判断を下せるようになります。これによって、モデルが意図した通りに動作することが保証されます。OCRモデルの場合、同じレイアウトの画像やPDFをセットで追加し、抽出したい値にタグ付けを行う必要があります。これにより、モデルはtraining dataからどの値を抽出すべきかを認識できるようになります。詳細はガイドラインセクションをご確認ください。
項目を追加し、必須の画像またはPDFをアップロードした後、アップロードした各トレーニングデータ内の該当する値に追加した項目をタグ付けする必要があります。これにより、モデルが参照し、どの値をトレーニングデータから抽出すべきかを特定できるようになります。トレーニングデータから抽出可能なすべてのデータはハイライト表示されます。必要なテキスト部分のみを選択して抽出することができます。
メモ:
- もし項目の追加を忘れた場合は、右側の項目セクション内にある+ 新規項目を追加をクリックすることで、項目を追加ページに戻らずに追加できます。
- 項目名の横にある三点リーダー(…)をクリックすると、項目の編集・削除や、誤って追加した項目値の削除が可能です。
メモ : すべての画像内で追加した項目にタグ付けを行っていない場合、これ以上進めません。。
トレーニングデータを追加した後、Model 名前、Model 種類、トレーニングデータの種類、および追加されたトレーニングデータの数(画像またはPDF)など、model の詳細を確認できます。修正が必要な場合は、戻って編集できます。問題なければ、そのままモデルのトレーニングに進めます。
OCRモデルをアプリケーションで実際に使用する前に、希望する動作を実現できるようトレーニングする必要があります。
トレーニングが完了すると、ユーザーはモデルのステータス(trained、失敗、下書き)、モデル種類、作成日・更新日、その他の詳細を以下の通り確認できます。
このセクションでは、モデルの現在のバージョン、トレーニングデータの種類、および抽出が必要な項目名を表示できます。
このセクションでは、モデルが持つバージョンの数、現在稼働中のバージョン、モデル作成日、追加された項目数、学習済みデータの件数を確認できます。
このセクションでは、できることとして、モデルがデプロイされているアプリ名、フォーム名、および項目名を表示できます。また、フィルターを使って異なる環境ごとに、どの環境にモデルがデプロイされているかを確認できます。
トレーニング後、アプリケーションにデプロイする前にモデルの信頼性をテストできます。これにより、モデルが必須値を正しく識別・抽出できることを確認できます。
モデルのトレーニング後、アプリケーションで利用できるように公開する必要があります。ユーザーはモデルを利用し、画像から値の抽出を開始できます。
メモ : 一度モデルを公開済みにすると、非公開に戻すことはできません。ただし、モデルの変更や再学習は引き続き可能です。
追加の画像やPDF(類似または多少異なるレイアウト)でモデルを再学習させることで、必須値やその他の情報をより正確に識別・抽出できるようになります。この再調整により、モデルの効率が向上し、法人ごとのニーズに合わせた最適化が可能です。
メモ:
- アプリケーションにデプロイされているモデルを削除すると、そのアプリケーションでのデプロイも削除されます。この操作は元に戻せません。
- 削除後も、追加された項目(モデルの入力項目および出力項目)は、該当モデルがデプロイされているフォーム内に残ります。OCRモデルからの過去データは、該当項目がフォームから削除されない限り保持されます。
- 現在使用中のモデルバージョンは削除できません。バージョンを切り替えてから、そのモデルバージョンを削除してください。
モデルのトレーニングとテストが完了したら、公開してユーザーが利用できるようにし、必要な値の抽出を開始できます。公開後は、アプリケーション内のユーザーがモデルを利用可能です。ユーザーにモデルを利用させたくない場合は、モデルを削除できます。
メモ : 訓練済みかつ選択済みのモデルは、「選択する Model」セクションですでに選択されています。ready-to-使用する OCR modelを作成する際にもモデルを選択できます。
メモ :
- 現在、画像およびファイルアップロード項目のみをデータ元 項目として追加できます。そのため、フォーム内で利用可能な画像またはファイルアップロード種類の項目のみがデータ元 項目の選択肢として表示されます。
- 選択したフォームに画像またはファイルアップロード項目が利用できない場合は、OCRモデルを展開する前に項目を作成する必要があります。
メモ :
- 抽出された項目とは、抽出された値がアプリの有効な方法で表示される項目を指します。
- 項目種類として番号を選択した場合、小数、割合(%)、通貨項目の値が含まれます。
- 項目種類としてテキストを選択した場合、単一折れ線グラフおよび複数折れ線グラフ項目の値が含まれます。
- 項目種類として日付を選択した場合、選択した形式に従った日付値のみが表示されます。
これでアプリにアクセスし、有効化された状態で、データ元項目に必須の画像またはPDFをアップロードできます。OCR 項目はアップロードされた入力内容を識別しようとし、抽出された値はextracted 項目に表示されます。
「導入したばかりで基本操作や設定に不安がある」、「短期間で集中的に運用開始できる状態にしたい」、「運用を開始しているが再度学び直したい」 といった課題を抱えられているユーザーさまに向けた少人数制のオンライントレーニングです。
日々の営業活動を効率的に管理し、導入効果を高めるための方法を学びましょう。