[B! OCR] hiroaki0916のブックマーク

hiroaki0916 id:hiroaki0916

OCRに関するhiroaki0916のブックマーク (2)

TessOCR
TessOCRの概要 tesseractは，HP社の研究所で1985〜1995年に開発され，現在はGoogle社に引き継がれた，日本語も含む多言語向けの光学文字認識（Optical Character Recognition）エンジンです。その文字認識の対象は，活字体です。tesseractはコマンド・ライン・ツールですので，一般の利用者にとっては使いづらいツールと思われます。すでにTesseractOCR，VietOCR，PDF OCR Xといった，GUIを介してtesseractを駆動するツールが登場しておりますが，古い書籍の文字認識を行う私の用途では，ボックスの編集，文字認識辞書の生成，テキストの編集などの統合的な機能も必要なことから，TessOCRの開発を思い立った次第です。私（岸　和孝）はインターネット上で公開されている多くの情報を参考にしてTessOCRを開発しました。関係者の
hiroaki0916 2012/05/17
OCR
リンク
NHocr: 日本語文字認識プログラムプロジェクト日本語トップページ - OSDN
NHocrはオープンソースの日本語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。 SourceForge.JPの本プロジェクトでは、パッケージの提供に加えて、NHocrに関する日本語による文書提供などのユーザサポートを行います。以下のサービスやアプリケーションでNHocrを試してみることができます。 * 日本語文字認識 (WeOCRサービス) * Capture2Text
hiroaki0916 2012/03/27
OCRのオープンソース

OCR

OSS

NHocr
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx