Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
shogun-toolbox の    Twitter: @chiral
                        礒部正幸
MKL を R で使う        (いそべまさゆき)
自己紹介
●   2003年 東工大修士(計算工学専攻)
    ●   研究テーマ: Prolog を使った記号的な統計モデリング
        –   http://sato-www.cs.titech.ac.jp/prism/
    ●   将棋の棋譜データから表層的な統計パラメータだけで「この人は
        強いかどうか?」を判別するなど
●   数学大好き。ルベグ積分や解析力学を趣味で学ぶなど
●   R 言語歴=6ヶ月くらい、 Tokyo.R 参加4回目(発表2回目)
●   大手電機メーカ~ベンチャー企業3社を経て起業

●   アドファイブ(株)代表取締役 CEO
    ●   次世代アドテクノロジーを開発するベンチャー企業
●   資金調達は OK !(1億の増資見込も!)社員絶賛募集中!

        → ストックオプションがっつりつけます!
MKL とは?(1)
●   カーネル法とは?

    ●   機械学習における数理モデルの多くは「データベクトルの内積」だけを
        使って記述できる
    ●   通常、内積は線形の識別境界を定めるが、「内積を計算する部分」を
        「カーネル関数」に置き換えることで高次元空間における識別境界が決
        まり、元の空間における非線形識別が可能になる → カーネルトリック
    ●   「内積を使う機械学習アルゴリズム」は全てカーネル法を使って非線形
        にできるが、中でも SVM の非線形化が有名
    ●   「カーネル関数」は直感的には「ベクトル(データ点)同士の類似度
        (=距離と逆で大きいほど類似している)」を定める
    ●   SVM などのカーネル法の性能は、類似性を上手く捉えたカーネル関数
        を設計できるかどうかにかかっている

    → けどカーネル関数の設計めんどい(高次元むずかしいし)
MKL とは?(2)
●   カーネル関数の作り方
    ●   「カーネル関数になる条件」を使って、「基本のカーネル関数
        を、組み合わせて大きなカーネル関数を作る」ことが出来る
    ●   http://www.kyoritsu-pub.co.jp/bookdetail/9784320122505

●   MKL ( Multiple Kernel Learning )とは?
    ●   「基本のカーネル関数」を組み合わせる(線形結合とか)

        ときの、重みパラメータなどを自動的に調整
    ●   「組み合わせ方」によって、 CanonicalMLK とか種類が色々ある
    ●   MKL 画像認識の分野で今アツい!!!

        → 様々な種類の特徴量を組み合わせて判別に用いるからだと思
        われ。
shogun-toolbox とは?
 ●   単体で動作するデータ分析・機械学習用パッケージソフト
 ●   いくつかの勉強会にて、言及、発表などされている
 ●   カーネル法に強い( SVM 、 KPCA などなど)
     ●   カーネル関数を取り替えて試したりとかがしやすい
     ●   MKL ( Multiple Kernel Learning :後述)をサポート
 ●   R 言語インターフェスを備えている!




MKL の詳細: http://www.shogun-toolbox.org/doc/en/current/classshogun_1_1CMKL.html
shogun-toolbox の MKL
識別関数



学習手順
将軍 R のインスコ
●   Ubuntu11.04 なら apt-get 一発
まずサンプルから動かしてみた…が

    すみません、発表準備まで
    時間が足りませんでした!!!
    (今日の午後から準備始めました ... )


続きは、
愛甲健二さん主催の「機械学習 × プログラミング」で発表します!
「カーネル関数の選び方」というさらにマニアックな話をします!

http://atnd.org/events/27962
shogun-toolbox について、詳しくは

 http://www.slideshare.net/yasutomo57jp/shogun
 80ページに渡る資料を作成されてる方がいるので、こちらを!
 ( R 言語インタフェースについてはそんなに書いてない)




 http://www.shogun-toolbox.org/
  公式サイトは情報山盛りです!
最後に!

         アドファイブ(株)
次世代アドテクノロジーを開発するベンチャー企業

            社員絶賛募集中!
    データ分析を始め、クラウドプラットフォーム

       リアルタイム処理、セキュリティ等など

        死ぬほど仕事あります!!!
    ご興味ある方は、 TwitterID: @chiral または
Facebook: https://www.facebook.com/masayuki.isobe.14

代表者(私):礒部 正幸(いそべ まさゆき)

More Related Content

Tokyo.R #22 LT

  • 1. shogun-toolbox の Twitter: @chiral 礒部正幸 MKL を R で使う (いそべまさゆき)
  • 2. 自己紹介 ● 2003年 東工大修士(計算工学専攻) ● 研究テーマ: Prolog を使った記号的な統計モデリング – http://sato-www.cs.titech.ac.jp/prism/ ● 将棋の棋譜データから表層的な統計パラメータだけで「この人は 強いかどうか?」を判別するなど ● 数学大好き。ルベグ積分や解析力学を趣味で学ぶなど ● R 言語歴=6ヶ月くらい、 Tokyo.R 参加4回目(発表2回目) ● 大手電機メーカ~ベンチャー企業3社を経て起業 ● アドファイブ(株)代表取締役 CEO ● 次世代アドテクノロジーを開発するベンチャー企業 ● 資金調達は OK !(1億の増資見込も!)社員絶賛募集中! → ストックオプションがっつりつけます!
  • 3. MKL とは?(1) ● カーネル法とは? ● 機械学習における数理モデルの多くは「データベクトルの内積」だけを 使って記述できる ● 通常、内積は線形の識別境界を定めるが、「内積を計算する部分」を 「カーネル関数」に置き換えることで高次元空間における識別境界が決 まり、元の空間における非線形識別が可能になる → カーネルトリック ● 「内積を使う機械学習アルゴリズム」は全てカーネル法を使って非線形 にできるが、中でも SVM の非線形化が有名 ● 「カーネル関数」は直感的には「ベクトル(データ点)同士の類似度 (=距離と逆で大きいほど類似している)」を定める ● SVM などのカーネル法の性能は、類似性を上手く捉えたカーネル関数 を設計できるかどうかにかかっている → けどカーネル関数の設計めんどい(高次元むずかしいし)
  • 4. MKL とは?(2) ● カーネル関数の作り方 ● 「カーネル関数になる条件」を使って、「基本のカーネル関数 を、組み合わせて大きなカーネル関数を作る」ことが出来る ● http://www.kyoritsu-pub.co.jp/bookdetail/9784320122505 ● MKL ( Multiple Kernel Learning )とは? ● 「基本のカーネル関数」を組み合わせる(線形結合とか) ときの、重みパラメータなどを自動的に調整 ● 「組み合わせ方」によって、 CanonicalMLK とか種類が色々ある ● MKL 画像認識の分野で今アツい!!! → 様々な種類の特徴量を組み合わせて判別に用いるからだと思 われ。
  • 5. shogun-toolbox とは? ● 単体で動作するデータ分析・機械学習用パッケージソフト ● いくつかの勉強会にて、言及、発表などされている ● カーネル法に強い( SVM 、 KPCA などなど) ● カーネル関数を取り替えて試したりとかがしやすい ● MKL ( Multiple Kernel Learning :後述)をサポート ● R 言語インターフェスを備えている! MKL の詳細: http://www.shogun-toolbox.org/doc/en/current/classshogun_1_1CMKL.html
  • 7. 将軍 R のインスコ ● Ubuntu11.04 なら apt-get 一発
  • 8. まずサンプルから動かしてみた…が すみません、発表準備まで 時間が足りませんでした!!! (今日の午後から準備始めました ... ) 続きは、 愛甲健二さん主催の「機械学習 × プログラミング」で発表します! 「カーネル関数の選び方」というさらにマニアックな話をします! http://atnd.org/events/27962
  • 9. shogun-toolbox について、詳しくは http://www.slideshare.net/yasutomo57jp/shogun 80ページに渡る資料を作成されてる方がいるので、こちらを! ( R 言語インタフェースについてはそんなに書いてない) http://www.shogun-toolbox.org/ 公式サイトは情報山盛りです!
  • 10. 最後に! アドファイブ(株) 次世代アドテクノロジーを開発するベンチャー企業 社員絶賛募集中! データ分析を始め、クラウドプラットフォーム リアルタイム処理、セキュリティ等など 死ぬほど仕事あります!!! ご興味ある方は、 TwitterID: @chiral または Facebook: https://www.facebook.com/masayuki.isobe.14 代表者(私):礒部 正幸(いそべ まさゆき)