Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser .
East-west cultural corridor on geoinformatics
less
Papers by Mamoru Shibayama
Annual Meeting of the Geological Society of Japan , 1997
The East and Southeast Asian countries have close economic relationships with Japan and the Unite... more The East and Southeast Asian countries have close economic relationships with Japan and the United States through trade and capital movements. Economic inter-
1. はじめに 古文書史料のデジタル化のため,翻刻作業の支援に OCRを用いるシステムの検討が行われており,古文書 の毛筆文字に特有のつづけ字やくずし字など,手書き 文字よりもさらに困難な技術的... more 1. はじめに 古文書史料のデジタル化のため,翻刻作業の支援に OCRを用いるシステムの検討が行われており,古文書 の毛筆文字に特有のつづけ字やくずし字など,手書き 文字よりもさらに困難な技術的課題を克服すべく,研 究が進められている.古文書文字列 (標題)を認識する 際にも,従来の手書き文字列認識の技術を応用が試み られているが,個別文字の場合と比較して,なお一層 困難である [1]. 従来の手書き文字列認識では,切出し,個別文字認 識を行ってから,その文字認識評価値を知識処理で統 合する方法が一般的である.しかし,このような直列 型の文字列認識システムでは,各モジュールのエラー が後段へと積み重なる可能性が高い.このことから, 一括認識 (holistic recognition)の方法が検討されてい る [2].一括認識とは,文字列全体をひとつの長方形と 考え,個別の文字認識と同じストラテジーで認識を行 うというものである. 文字列の一括認識を行う際に検討すべき課題は,文 字列を長方形枠に拡大する手法 (画像正規化),および, 文字数が増加するにつれて特徴量の次元数が増加する こと (特徴量抽出)である.手書き文字列における一括 認識に関する従来研究として,文献 [3][4]が挙げられ る.これらの文献においてそれぞれ画像正規化および 特徴量抽出の問題に取り組んでいるものの,個別文字 認識と同程度の性能が引出せているとは言い難い.ま た文献 [4]では,画像正規化に非線形正規化をそのまま 適用した場合 [5],線形正規化と同程度の正規化の効果 しか得られないことが指摘されており,さらに文献 [6] にて指摘されているように,古文書文字列の認識にお いては,文字の正規化で字形変化が生じ,類似クラス への誤読が多発するため正規化は容易ではない. 本稿では,個別文字認識で有効な非線形正規化法を, 文字列認識へ適用する手法を提案する.非線形正規化 の特性値を算出する際に対象区間を設定することで不 自然な字形変化を行うことなく,文字列の大幅なゆが みを抑制した.また,正準判別分析を導入することに より,Wilksの Λ基準による F検定を用いた変数選択 によって次元削減を行った. 古文書標題データベース「HCD2」の 5クラス 112サ ンプルを用いた,Leave...
TRENDS IN THE SCIENCES , 2012
TRENDS IN THE SCIENCES , 2012
IEEJ Transactions on Electronics, Information and Systems , 1998
IEEJ Transactions on Electronics, Information and Systems , 1998
Annual Meeting of the Geological Society of Japan , 1997
The East and Southeast Asian countries have close economic relationships with Japan and the Unite... more The East and Southeast Asian countries have close economic relationships with Japan and the United States through trade and capital movements. Economic inter-
1. はじめに 古文書史料のデジタル化のため,翻刻作業の支援に OCRを用いるシステムの検討が行われており,古文書 の毛筆文字に特有のつづけ字やくずし字など,手書き 文字よりもさらに困難な技術的... more 1. はじめに 古文書史料のデジタル化のため,翻刻作業の支援に OCRを用いるシステムの検討が行われており,古文書 の毛筆文字に特有のつづけ字やくずし字など,手書き 文字よりもさらに困難な技術的課題を克服すべく,研 究が進められている.古文書文字列 (標題)を認識する 際にも,従来の手書き文字列認識の技術を応用が試み られているが,個別文字の場合と比較して,なお一層 困難である [1]. 従来の手書き文字列認識では,切出し,個別文字認 識を行ってから,その文字認識評価値を知識処理で統 合する方法が一般的である.しかし,このような直列 型の文字列認識システムでは,各モジュールのエラー が後段へと積み重なる可能性が高い.このことから, 一括認識 (holistic recognition)の方法が検討されてい る [2].一括認識とは,文字列全体をひとつの長方形と 考え,個別の文字認識と同じストラテジーで認識を行 うというものである. 文字列の一括認識を行う際に検討すべき課題は,文 字列を長方形枠に拡大する手法 (画像正規化),および, 文字数が増加するにつれて特徴量の次元数が増加する こと (特徴量抽出)である.手書き文字列における一括 認識に関する従来研究として,文献 [3][4]が挙げられ る.これらの文献においてそれぞれ画像正規化および 特徴量抽出の問題に取り組んでいるものの,個別文字 認識と同程度の性能が引出せているとは言い難い.ま た文献 [4]では,画像正規化に非線形正規化をそのまま 適用した場合 [5],線形正規化と同程度の正規化の効果 しか得られないことが指摘されており,さらに文献 [6] にて指摘されているように,古文書文字列の認識にお いては,文字の正規化で字形変化が生じ,類似クラス への誤読が多発するため正規化は容易ではない. 本稿では,個別文字認識で有効な非線形正規化法を, 文字列認識へ適用する手法を提案する.非線形正規化 の特性値を算出する際に対象区間を設定することで不 自然な字形変化を行うことなく,文字列の大幅なゆが みを抑制した.また,正準判別分析を導入することに より,Wilksの Λ基準による F検定を用いた変数選択 によって次元削減を行った. 古文書標題データベース「HCD2」の 5クラス 112サ ンプルを用いた,Leave...
TRENDS IN THE SCIENCES , 2012
TRENDS IN THE SCIENCES , 2012
IEEJ Transactions on Electronics, Information and Systems , 1998
IEEJ Transactions on Electronics, Information and Systems , 1998
Log in with Facebook Log in with Google
Uploads
Papers by Mamoru Shibayama