今回は「Tesseract OCR」と「PyOCR」を使用して、OCR(光学的文字認識)を試してみました。 #Tesseract OCRとは https://github.com/tesseract-ocr/tesseract 「Tesseract OCR」はGoogle、HPが開発したオープンソースOCRエンジン。 Unicode(UTF-8)をサポートしており、100以上の言語を「そのまま」認識できます。 #PyOCRとは https://gitlab.gnome.org/World/OpenPaperwork/pyocr 「PyOCR」はPython用のOCRツールラッパー。 PythonプログラムからさまざまなOCRツールを使用できます。 現在サポートされているOCRツールは以下の3種類。 Libtesseract Tesseract Cuneiform #環境構築 ※実行環境はM