Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

OCRに関するhiroaki0916のブックマーク (2)

  • TessOCR

    TessOCRの概要 tesseractは,HP社の研究所で1985〜1995年に開発され,現在はGoogle社に引き継がれた,日語も含む多言語向けの光学文字認識(Optical Character Recognition)エンジンです。その文字認識の対象は,活字体です。tesseractはコマンド・ライン・ツールですので,一般の利用者にとっては使いづらいツールと思われます。すでにTesseractOCR,VietOCR,PDF OCR Xといった,GUIを介してtesseractを駆動するツールが登場しておりますが,古い書籍の文字認識を行う私の用途では,ボックスの編集,文字認識辞書の生成,テキストの編集などの統合的な機能も必要なことから,TessOCRの開発を思い立った次第です。私(岸 和孝)はインターネット上で公開されている多くの情報を参考にしてTessOCRを開発しました。関係者の

  • NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN

    NHocrはオープンソースの日語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。 SourceForge.JPのプロジェクトでは、パッケージの提供に加えて、NHocrに関する日語による文書提供などのユーザサポートを行います。 以下のサービスやアプリケーションでNHocrを試してみることができます。 * 日語文字認識 (WeOCRサービス) * Capture2Text

    NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN
    hiroaki0916
    hiroaki0916 2012/03/27
    OCRのオープンソース
  • 1