DENKnet OCR - 文字を混在させることなく確実に文字認識

OCR結果は、新しい出力フィルタを使用して、個々の文字間の関係を認識するようになりました。

カメラ画像から印刷または手書きテキストを機械が読み取り可能なテキストデータに変換することは、OCRシステムにとって依然として最も難しいタスクの1つです。よく似た文字を認識することで、麦と籾殻を分けることができます。「O」と「0」や、「4」を「A」と認識するような文字の混在は、たとえ非常に優れた入力データであっても、完全には避けられません。

DENKnet OCRのDeep OCRモデルは、このようなケースにも対応しています。個々の文字を認識するだけでなく、その関係性も非常に高い精度で考慮されるようになりました。これは新しい出力フィルターによって可能になり、表示される結果単語の形式のみをより正確に定義することができます。例えば、日付を読み出す場合、日付の書式(例:「01/01/0123」)を指定することができます。