PDF内の画像文字からテキストを抽出できるOCR
現在、PDFファイルで英文を翻訳機にかけたいと思っているのですが、20~30年前の部品のデータシートで何かスキャナーからこのデータシート資料を取り込んだらしく、文字が画像としてしか認識されずテキストをコピペすることができないのです。
文字はすべてアルファベットなどで構成されています。多少スキャン時にページが傾いている感じがあるくらいでOCRソフトのRealReader Lite 7.0でjpegファイルから”スマート認識”でとりだそうとしたのですが、
すこし誤変換が多いような気がしました。
このようなすべて画像で構成されているPDFファイルから文字のとりだしやすいOCRソフトなどご存じの方いらっしゃいませんでしょうか?
ぜひ、教えて頂きますよう、お願い致します。
お礼
回答ありがとうございました。これで、私の目的は達することができそうです。高価なソフトだけは知っていたのですが、これで楽に導入できます。\(=^o^=)/