お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の
英語版を参照してください。
Optical Character Recognition(OCR)モデルは、テキスト認識モデルであり、デジタル画像やPDFから(印刷・手書きの両方の)テキストを識別・抽出します。モデルをトレーニングすることで、デジタル画像またはPDFをスキャンし、機械学習を活用して必要な情報のみを抽出できます。大量の非構造化データから構造化データを処理・取得したい場合に特に有効です。このように抽出された構造化データは、必要に応じて企業で保存・処理でき、データ入力業務の簡素化や自動化に役立ちます。例えば、構造化データはメールの日付や時間であり、非構造化データはメール本文全体となります。
Creatorでは2種類のOCRモデルに対応しています。法人のニーズに合わせたカスタムモデルを作成することも、よく使われる法人シナリオ向けにすぐに利用できる(プリビルト)モデルを選択してアプリケーションに導入することも可能です。
カスタムOCRモデルを作成し、必要な値のみを識別・抽出するようトレーニングできます。カスタムOCRモデルは、業界をリードする複数のテキスト認識技術を組み合わせてテキストを特定・ハイライトします。モデルが識別した抽出可能なテキストはすべてハイライト表示され、タグ付けされていない値であることが示されます。その後、画像から抽出したい項目を追加・タグ付けできます。モデルは画像内の必要なテキストを抽出・処理するようにトレーニング可能です。
- - OCRモデルはフォントの種類に関係なく画像からテキストを抽出できます。
- - モデルは印刷・手書きの両方のテキストを検出可能ですが、印刷テキストの使用を推奨します。手書きテキストのバリエーションが多い場合、必要なテキストの処理が困難になることがあります。
OCRモデルの前提条件
カスタムOCRモデルを作成・トレーニングし、法人のニーズに合わせてカスタマイズできます。また、
すぐに利用できるOCRモデルもご利用いただけ、アプリケーションに直接導入可能です。
たとえば、特定の入力画像からテキスト差出人を抽出したい場合、カスタムOCRモデルの利用が適しています。一方、入力画像から検出されたすべてのテキスト差出人を抽出したい場合は、すぐに使用できるOCRモデルが利用可能です。これは、PDFからテキスト差出人を抽出する場合にも、カスタムおよびすぐに使用できるOCRモデルの両方に当てはまります。
- 管理者はOCRモデルの作成および使用が可能ですが、ユーザーは作成済みモデルの利用のみ可能です。
- モデルのトレーニングに使用するデータセットを決定するため、法人の要件について十分に把握しておく必要があります。
- Creatorは低コードプラットフォームのため、管理者やユーザーに事前のコーディングや機械学習(ML)スキルは不要で、予測モデルの作成や利用が可能です。
- トレーニングデータとして、レイアウトが類似した画像を最低5枚アップロードする必要があります。
- 異なるレイアウトの画像でも、抽出値を正しくタグ付けすれば利用可能です。
PDFベースのOCRモデル
- カスタムOCRモデルの場合、必須テキストを抽出するために、最大2ページまでの類似レイアウトを持つPDFを5つ以上用意する必要があります。
- AIモデルは、すべての支払い済み プランのユーザーが利用可能です。詳細は料金ページをご参照ください。
どのバージョンのCreatorを使用すべきですか?
- カスタムAIモデルを作成するにはZoho Creator 6(C6)の利用が必要です。一方、すぐに使用できるAIモデルはC6およびC5の両方で利用可能です。
たとえば、Creatorを使ってZylker請求書処理アプリを構築したとします。請求書詳細というフォームがあり、請求書の詳細とともに請求書のデジタルコピーを追加します。請求書から請求書日付、請求書番号、支払期日、請求先住所など特定のデータを抽出する必要があります。これは紙の請求書をもとに手作業で支払い処理や取引先管理を行うことで対応可能です。しかし、複数のエントリーがある場合、抽出プロセスを自動化することで多くの時間と手作業を削減できます。
上記のケースでOCRモデルを使用する方法は以下の通りです。
- モデルの作成:
- 抽出する値を特定し、それぞれの値を保存するための項目と項目タイプを選択します。ここでは、請求書番号、請求書日付、Due日付、Billing住所が抽出対象となります。
- 同様または異なるレイアウトの十分なトレーニングデータをアップロードし、抽出が必要な値に該当する定義済み項目にタグ付けします。ここでは、請求書の画像またはPDFをアップロードしてください。
- モデルのトレーニング
- モデルのデプロイ:
- フォーム内でモデルへの入力となる画像またはファイルアップロード項目を選択します。
- 先ほど定義した項目を追加し、画像項目から抽出された値を保存できるようにします。ここでは、請求書番号、請求書日付、Due日付、Billing住所が抽出値を保存する項目となります(上記GIFを参照)。
- 必要な値を取得するために画像またはPDFをアップロードします。この場合、入力は請求書の画像またはPDFとなります。
OCRモデルの流れ
モデルのセットアップ
トレーニングデータの追加
トレーニングデータは、モデルがデータパターンを分析し、解釈を行い、テキスト認識に役立つ結論を導き出すために使用される初期データセットです。OCRモデルをトレーニングするには、同様または異なるレイアウトの画像やPDFを十分に収集する必要があります。次に、収集した画像や作成したPDFから抽出したい値を特定します。トレーニングデータが確定したら、OCRモデルに項目を追加し続けることができます。
- モデルの結果は常に正確とは限りません。これは他のAIにも共通しています。
- モデルの結果は動的です。同じ入力でも、機械学習の進捗によって異なる結果が出る場合があります。つまり、再学習を継続的に行うことで、モデルも継続的に学習していきます。
Creator では、フォームの項目はユーザーが入力した値を保存します。同様に、抽出したい値も該当する項目に表示されます。項目を追加することで、その定義を確立できます。モデルをCreatorアプリケーションに実装すると、これらの項目がアプリケーションのフォームに一覧表示されます。あらかじめ定義された項目を必須として選択または選択解除できます。抽出したい値がtraining dataから特定できたら、項目とそれに対応する
データ型を追加してください。
サポートされているデータ型にはtext、番号、日付が含まれます。
追加する Training Data
収集した画像や、以前作成したPDFがここで役立ちます。画像やPDFは、受取請求書、小切手、請求書、パスポート、領収書などを含む写真やドキュメントが利用できます。これらのドキュメント内のテキストは手書きまたは印刷されたものでも構いませんが、印刷されたテキストが推奨されます。
メモ : 手書きおよび印刷された画像やPDFの両方をアップロードできます。すべての画像で抽出値に正しくタグ付けを行い、モデルが希望する値を特定・抽出できるようにしてください。
Tag 項目
すべて追加した項目にタグ付けした後、必要に応じてここから新規項目を直接追加できます。Tag 項目ドロップダウンで追加する 新規 項目をクリックしてください。このオプションは、追加済み項目がモデルごとに10未満の場合のみ表示されます。
必要なトレーニングデータをアップロードすると、それぞれのテキストがハイライト表示されます。次に、先ほど追加した項目の値をすべてのアップロード済み画像/PDFでタグ付けする必要があります。ここでのタグ付けとは、追加した項目を抽出・表示すべき値にマッピングまたは関連付けることを指します。画像やPDFページ内の該当する値を選択してドラッグすることで、値にタグ付けできます。例えば、請求書 番号項目(データ型:番号)を追加した場合、画像内の請求書番号の値にタグ付けする必要があります。これにより、OCRモデルが抽出すべき項目値として認識できるようになります。

ガイドライン
形式
- 対応形式として利用可能な画像はJPEG、PNG、BMP、TIFです。
- アップロードする各画像の最大サイズは5 MBです。
- モデル全体のサイズは150 MBを超えないようにしてください。
- アップロードする各PDFの最大サイズは5 MBです。
- カスタムOCRモデルの場合、同一レイアウトのPDFは最大2ページが必要です。
- 現在サポートされているのは日本語のみです。
その他
- クリアな画像をアップロードしてください。
- 異なるレイアウトの画像をアップロードする場合は、抽出値に正しくタグ付けを行ってください。
- 正確な認識および抽出のためには、同じレイアウトの画像を最低5枚アップロードする必要があります。
- トレーニングを成功させるためには、各項目を最低5枚の画像で該当する値にタグ付けする必要があります。
- 1つのモデルにつき、項目種類を持つ最小1項目、最大10項目まで抽出できます。
- フォームにOCR項目を追加するには、画像項目をそのフォームのデータ元項目として設定する必要があります。データ元項目は、モデルがテキストを識別・抽出するために入力画像をアップロードする項目を指します。対応する項目種類がフォームに利用可能でない場合は、OCRモデルを導入する前に作成する必要があります。
Model 概要
トレーニングデータを追加した後、model 詳細でModel 名前、Model 種類、training data、追加された画像の番号などを確認できます。修正が必要な場合は、戻って編集できます。問題なければ、そのままモデルのトレーニングを続行してください。
モデルをトレーニング
OCR model を実際にアプリケーションで使用する前に、希望する動作を実現するためにトレーニングが必要です。トレーニングデータを選択し、内容を確認したら、Train をクリックしてモデルをトレーニングしてください。
メモ : トレーニングには多少の時間がかかる場合があります。ページを移動せずにそのままお待ちいただくか、ページを閉じて後で戻ることも可能です。トレーニング時間はモデルのサイズや、キュー内のトレーニングモデル数によって異なります。
モデル詳細の表示と管理
モデルのトレーニングが完了すると、モデルの詳細、バージョン、デプロイメントの詳細(該当する場合)を表示できます。モデルは公開およびアプリへのデプロイが可能な状態となります。
モデルは以下の方法で管理できます。
- 再トレーニング - 新しいデータは常に作成されるため、定期的な再トレーニングを推奨します。これにより、OCRモデルの信頼性や値の抽出精度が向上します。
- 「Re-train model」をクリックすると、モデルが再学習されます。
- 各再学習が完了するたびに、新規バージョンのモデルが作成されます。ニーズに応じて、異なるバージョン間で切り替えることができます。
- 現在使用中のバージョンを削除したい場合は、削除を行う前に別のバージョンへ切り替える必要があります。
- モデルの学習に失敗した場合、「Model training has 失敗!」と表示されます。その間、以前の動作していたモデルが予測に使用されます。
メモ:
- 再学習オプションは、フォーム項目を通じてトレーニングデータを追加した場合のみ利用可能です。これは、新規データが継続的にアプリケーションへ追加される際に、随時モデルを学習させることができるためです。
- CSVファイルでデータを追加する場合は、モデルを削除し、新規ファイルをアップロードしてから再度モデルを学習させることができます。
- 名前を変更する - 必要に応じてモデルの名前を変更できます。
- 削除 - データの不整合や誤った追加があった場合は、削除オプションを使用してモデルを削除できます。
テスト model
モデルをアプリケーションで公開・展開する前にテストすることを推奨します(必須ではありません)。
トレーニング後から公開前までの間に、モデルの動作を確認するためにテストを行うことができます。トレーニング結果に満足できれば、アプリケーションに展開する前に進めてください。テストデータをアップロードし、テスト後に抽出された値を結果として取得できます。
- 期待通りの結果が得られない場合は、モデルを再トレーニングするか、モデル詳細を編集して再度トレーニングしてください。再トレーニングとは、編集を加えずにモデルを再度トレーニングすることを指します。モデルは継続的に学習しています。
- モデルのテスト時には、一度にアップロードできる画像は1枚のみです。
- OCRモデルのガイドラインについては、こちらをクリックしてください。
トレーニング・テスト・評価が完了した後は、モデルのパフォーマンス向上のために調整が可能です。モデルの精度向上に役立つポイントを以下にご紹介します。
- 画像やPDFを収集・作成する際は、文字が正しく整列していることを確認してください。これによりモデルがテキストを認識しやすくなります。
- 高品質な画像やPDFを収集・アップロードするようにしてください。トレーニングデータの元の品質が高いほど、文字と背景の分離が容易になり、OCRモデルの精度も向上します。
- テキストと背景のコントラストを高めることで、出力結果の明瞭さをさらに向上させることができます。
- 印刷されたテキストに対して使用する場合、OCRエンジンは非常に高い精度を発揮します。
- 画像やPDFページが逆さまになっていないことを確認してください。画像は正しい形式で取得し、テキストが水平に表示されていることを確認しましょう。
モデルのトレーニングが完了したら、公開してユーザーが利用できるようにし、予測を開始できます。
方法はこちら
モデルは一度だけ公開できます。ユーザーにモデルを使用させたくない場合は、モデルを削除することができます。
OCRモデルを環境対応のCreatorアプリケーションで使用するには、そのアプリケーションのバージョンが少なくとも1つ、
本番環境で公開されている必要があります。アプリケーションにモデルをデプロイした後、
環境の各ステージ間でフィルターをかけて、どのステージにモデルがデプロイされているかを確認できます。
方法はこちら
モデルを公開した後、デプロイしたいアプリケーションとフォームを選択する必要があります。選択したフォームにリダイレクトされ、以前に定義した
項目がフォームビルダーに一覧表示されます。項目を必須として選択または選択解除できます。選択解除された項目はそのフォームに追加されません。例えば、同じOCRモデルを2つのフォームで使用する場合、両方のフォームで同じ項目セットが必要とは限らず、不要な項目は選択解除できます。
新しいOCR項目がフォームに追加され、任意の画像をアップロードできるようになります。OCRモデルが画像を解析し、抽出された値を定義した項目に表示します。
メモ: 学習済みモデルを選択する前に、参照されていない画像またはファイルアップロード項目(どこにも使用されていない項目)をフォームに追加してください。
サンプルデータで開始する
OCRをすぐに始められるよう、Creatorアプリケーションですぐに利用できるサンプルデータを提供しています。下にスクロールして添付ファイルをダウンロードしてください。