クラウド時代のWebアプリケーション・スマートフォンアプリを開発・運用する会社です。 03-4577-8680 03-6673-4950 久々にMeCabを使おうと思ったんですが、そういえば辞書の違いによる結果の違いはどれくらいあるんだろう?と思い立って検証してみることにしました。 MeCabで一般的に使われる辞書は ・IPA辞書 ・unidic ・NAIST辞書 の3つです。 解析結果は入力する文章の傾向によってかなり左右されることが過去わかっているので、いくつか文体の異なるテキストを用意して解析させてみました。 1)新聞記事 まず、辞書を作成するために多くの新聞記事が利用されています。よって、新聞記事に近い文体の文章は、どの辞書でもかなり近い結果になります。 2)エンタメ誌記事 ほぼ同じですが、「教科書的でない語」の分解に若干差が見られます。 例:IPA辞書・NAIST辞書「修羅場」u