タグ

hmmに関するrin1024のブックマーク (4)

  • mizzy.org perlで人工無脳 #1

    今回はマルコフ連鎖を利用した文章の自動生成について考えてみます。 A → B → C → D という一連の事象が発生する場合に、ある事象の発生する確率が、直前の事象にのみ依存するような状態を、マルコフ連鎖といいます。つまり、Cという事象が発生する確率は、Bにのみ依存していて、Bの前にAが起こっていることは全く関係ない、ということですね。 このマルコフ連鎖を利用した文章の自動生成を行うために、まずはマルコフ連鎖に基づいた文章生成用のデータを作成する必要があります。このデータをマルコフ辞書と呼びます。マルコフ辞書の中には、『「A」という単語の後には「B」という単語がつながる』という情報がたくさん入る、というイメージになります。 マルコフ辞書の生成も、前回のパターン辞書と同様に、予め発言データ用意しておいて、そこから生成することを考えます。 例えば、「私の息子はカレーパンマンと言うことができず、

  • 隠れマルコフモデルについてのイントロダクション - ryamadaの遺伝学・遺伝統計学メモ

    このレビューは短く(2ページ)、述べるべきをほぼ尽くしている 隠れマルコフモデルとは 統計モデルのひとつ 統計モデルは簡単にいうと、知りえた情報をもとに、知りたい真実へとたどり着くための道筋のこと 統計モデルの若干長い説明はこちら 知りたい真実が複数の要素からなっている その要素の間には相互関係がある このような場合には、すべての要素の真実を知ろうとしたときに、突然にすべての要素の真実がわかることはない(あるかも知れないが、現時点のコンピュータ技術ではできないし、ヒトの脳という精密機械では、直観という名の下に可能かもしれないが、その直観は検証不能(他者に説明不能)という意味で、やはり不可能と考えるのが妥当である。ただし、量子コンピュータなどの登場で事情は変わるかも知れない) では、複数の知りたい要素のうち、1つの要素の真実を知ってから(知ったことにしてから)次の真実についてを決める、という

    隠れマルコフモデルについてのイントロダクション - ryamadaの遺伝学・遺伝統計学メモ
  • 人工無脳レビュー

    Fig. 1に最近の人工無脳の能力の、独断に基づいた分布を示す。横軸は学習能力、縦軸は文脈追跡能力を示している。近年この勢力図は大きく変わった。マルコフ文生成を行なう人工無脳の一派の台頭と、限定的ながら論理を追跡して会話に反映させる人工無脳の技術の出現である。かつて人工無脳の代名詞と考えられていた辞書型はいまや旧世代のアーキテクチャに属し、その範疇では新しい技術開発が停滞している模様である。ログ型アーキテクチャは以前から存在していたのだが、いつの時代にもあまり大きな勢力にはなっていないようである。これらの情勢の変化はマシンパワーの増大と人工無脳業界への形態素解析器の導入に伴って生じたと考えられる。以下に各人工無脳の特徴を簡単に述べる マルコフ文生成型 マルコフ連鎖を用いて文を生成する。後述の辞書型人工無脳は辞書を拡大することでよい反応をするようになるが、マルコフ文生成型は逆で、生成する文の

    rin1024
    rin1024 2010/05/06
  • RSS を読み込んでランダムな文章を生成する

    RSS を読み込んでランダムな文章を生成する 2008-09-07-3 [Programming][NLP][IIR][WebAPI] 今日のIIR輪講[2008-09-07-2]の内容のフォローも兼ねて、ちょっとしたハックを紹介。 bigram language model に基づく、ランダム文生成を行います。 って、まあ、単純にある単語の次に現れる単語の分布を用いて、文章を生成していくだけですが。 以下、サンプルプログラムと実行例です。 サンプルコード rss-lm.pl #!/usr/bin/perl use strict; use warnings; use XML::RSS; use LWP::Simple; use XML::Simple; use URI::Escape; use utf8; binmode STDOUT, ":utf8"; my $appid = "Yaho

    RSS を読み込んでランダムな文章を生成する
    rin1024
    rin1024 2009/06/04
    "RSS(日本語)を読み込んで、テキストを形態素解析し、 単語2連続(bigram)をカウントしています"
  • 1