2013/9/12-13に山梨大学甲府キャンパスで開かれた情報処理学会自然言語処理研究会で研究報告をしました. 内容は教師なし・半教師あり形態素解析の話で,これまでやられていなかった分かち書きと品詞推定を同時に獲得しようというものになります. 言語処理に関わる者として,一度は自分なりの形態素解析を作ってみたいと思っていましたがその第一歩となります. はじめたばかりの研究ですが,皆様から頂いたコメントを反映させつつ発展させて行こうと思います.

英文の中から名詞のみを抽出することを検討している。 日本語と違い、英語はスペースで分かち書きしているので、「の、は、が」とかを分析する形態要素解析は簡単なようだ。 したがって、自然言語処理(NLP Natural Language Processing)の技術のうち、品詞判断を実現するツールを探してみた。 この手のツールは、POS Tagging(Part-of-Speech Tagging: 品詞タグ付け)と呼ぶそうだ。 いろいろと探してみた結果、Eric Bill氏が1993年に開発した "Bill Tagger"が有名で、かなりのツールはこのエンジンを利用している。 http://en.wikipedia.org/wiki/Brill_tagger Bill氏は、今マイクロソフト社に勤務しているとのこと。彼のオリジナルツールは、"Error-driven"であり、"tranforma
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く