OCR

OCR(Optical Character Recognition, 光学文字認識)は、画像やスキャンされた文書に含まれる文字をデジタルデータとして認識し、編集可能なテキスト形式に変換する技術のことです。

通信

「NDL古典籍OCR-Lite」公開

NDL古典籍OCR-Liteは、ノートパソコン等の一般的な家庭用コンピュータやOS環境で、江戸期以前の和古書、清代以前の漢籍といった古典籍資料のデジタル化画像からテキストデータが作成できる軽量なOCRです。