11. • 問い1 ゆがみの無いコイン → 表裏の出る確率は 1/2 • 問い2 ある商店街 → 場所によって男女比が違う 男女の通る確率は不確定 ベイズ確率
By: Jeff Schneider, Mary Soon Lee, Andrew Moore Description: A tutorial on using the Windows Vizier software, which provides a GUI for doing fast and autonomous locally weighted learning and nearest neighbor style learning. The Vizier software itself is available for free download at http://www.cs.cmu.edu/~awm/vizier, where you will find more details. Description: This is a link to the Auton Codin
2013/10/19 "第30回 データマイニング+WEB @東京 ( #TokyoWebmining 30th) −機械学習活用・マーケティング 祭り−"を開催しました。 第30回 データマイニング+WEB@東京 ( #TokyoWebmining 30th) ー機械学習活用・マーケティング 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者Twitter List: Twitter List TokyoWebmining 30th 参加者セキココ:第30回 データマイニング+WEB @東京 セキココ (作成してくれた [
8. 対象とする「数式」 • 行列やその要素の掛け算が出てくる数式 – 機械学習などの手法には、行列を使って表さ れているものが多い – 強力な線形代数ライブラリをうまく使えば楽 に実装できる • 数式の例はC.M.ビショップ「パターン認 識と機械学習」(以降 PRML)から採用 – ただし機械学習の知識は一切要求しない 9. 方針 • 「楽に」「確実に」実装しよう – 間違いにくく、可読性が高い – 最速は必ずしも目指していない • 動くものを確かに作れるようになってから • Python/numpy と R での実装例を紹介 – 基本的な行列計算しか使わないので、その他 の環境(Eigen など)にも参考になる(はず)
イベントページ: http://atnd.org/event/spro2013 日時: 2013/08/25 場所: ドリコム (講演者の方の氏名は敬称略) [招待講演] パーソナルデータ保護法制に向けた最近の動向 高木浩光(産業技術総合研究所) ここ2年ほどで急にきわどい事例が出始めた (なんかたがが外れた感じ。技術的に実現可能になったからではない) 本人の同意があれば問題ない ただし、真に同意があると言えるか疑わしい事例あり 契約上の同意だけでなく、自主的な同意がないとダメというのが法律家の意見 コンテキストに沿わない取得と利用(誤認誘導型) 特定の個人を識別できないデータならOKという主張 なぜそう思うの?逆になぜ特定の個人を識別できるデータはヤバいと思うの? 個人情報保護=連絡先の保護と誤解している人も何割かいる 何をもって匿名化されていると言えるか PPDM privacy pr
執筆陣12人中8人が直接の知人友人というこの新刊書でございますが。 データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus) 作者: 佐藤洋行,原田博植,下田倫大,大成弘子,奥野晃裕,中川帝人,橋本武彦,里洋平,和田計也,早川敦士,倉橋一成出版社/メーカー: 技術評論社発売日: 2013/08/08メディア: 大型本この商品を含むブログ (4件) を見る もちろん僕も発刊が決まってAmazonに予約ページができた時点でポチりまして、読んでみたところあまりにも内容が素晴らしかったので早速現職場の図書コーナーに持ち込んだ次第です(笑)。ということで、僭越ながら書評など書かせて頂こうかと思います。 ざっくり内容紹介 正直言って、ものすごーーーく網羅的で非常によく出来ています。1ページ目から順に読んでいっても初学
私は2013年6月に、3人のトップデータサイエンティストが集った「日米データサイエンティスト頂上座談会」に立ち会う好機を得た。このとき、米ヤフーなどでデータサイエンティストを歴任した米ピボタルのアニカ・ヒメネス氏は、データサイエンティストに求めるコアとなる2大スキルは「統計学とプログラミング能力です」と言い切った(関連記事:「統計学とプログラミング能力の2つが両立していないと、採用でイエスと言えません」)。 正直言うと、私はこの話を聞きながら、「それは厳しい条件だな」と思った。なかなか日本には、この2つを満たせる人はいないだろう。 加えて座談会に集まった3人は、データサイエンティストにはコミュニケーション能力も必要であることで考えが一致。ますますハードルが高く感じられた。 ところがそれから約1カ月半後、上記の素養を満たす人に取材で会うことができた。相手はディー・エヌ・エー(DeNA)にいた
はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれた本が多いが、日本語で書かれた本も若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論
Amazonサイト上で、1冊の本のランキングを追跡すれば、書店全体の売上傾向がわかる。 そんなことを数理的に詳しく調べた研究があります。 Amazonランキングの謎を解く: 確率的な順位付けが教える売上の構造 (DOJIN選書) 作者: 服部哲弥出版社/メーカー: 化学同人発売日: 2011/05/30メディア: 単行本購入: 4人 クリック: 551回この商品を含むブログ (26件) を見る 著者である服部哲弥先生の解説ページはこちら。 この"ランキング本"の帰結によると、Amazonは実はロングテールビジネスではない、とのことです。 一方、Wikipedia の「ロングテール」の項目には 「代表的なオンライン小売店の1つである「Amazon.com」(アマゾン社)を例に説明する。」 と記されているくらいですから、これはかなり意外な結果ではないでしょうか。>> wikipedia:ロング
一般に、データ分析の大半はそれほど高度なテクニックの類を必要としないものです。僕も常日頃から口に出して言うことが多いんですが、「統計学だの機械学習だのの出番なんてそもそも少なくて当たり前」。工数もかかるし、できればやらない方が良いです。ぶっちゃけ単純な四則演算で十分なケースの方が多数派でしょう。 なので、普段はDB上でSQL(というかHiveなど)でサクッと四則演算だけで集計処理を済ませてしまって、その結果だけを表示するようにしておいた方が圧倒的に楽で手っ取り早いはず。多くのBIツールもそういう考えのもとで作られていると思います。 ところがどっこい。世の中には、単純な四則演算での集計結果と、データサイエンスを駆使した分析結果とで、食い違ってしまうケースが何故かあることが知られています。どちらかと言うとレアケースだとは思いますが、その矛盾をおざなりにするととんでもないことになることも多々あり
はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、
大手ITベンダーの研究所でビッグデータ活用に携わった経験を生かし、データサイエンティストに関する情報を発信する株式会社プリファードインフラストラクチャーの比戸将平氏に話を聞いた。 ―前職のIBM東京基礎研究所でデータ解析関連のプロジェクトを担当された経験を活かし、データサイエンティストに関する講演をされています。データ分析の現場を生々しく描かれていますね。 昨年ごろから、データサイエンティストという言葉を耳にする機会が増えました。興味を持って調べてみたところ、かつて私が担当していた業務そのものでした。当時、私は機械学習やデータマイニングを使って、顧客をセグメンテーションしたり、機械が壊れる前に兆候を検知したりする仕組みを構築していました。それならば、データサイエンティストと呼ばれる人材の実態や、悩みどころをシェアできるのではないかと考えたのです。 昨今、データサイエンティストには、期待が集
はじめに なぜか唐突にRブームが俺の中でやってきてしまってどうしようもないので、Rの本を注文しまくってたりしていたら、下のような本の山が出来てしまいました。 これらの本を付箋でペタペタしながら読み進めていくうちに、段々とRというのはどういう言語で、どういう風に勉強するといいのか、という方針が固まってきたので、ここにメモをしておきます。 Rとはどのような言語か 一言で、しかも乱暴に言ってしまうならば「統計に特化したPHP」というのが一番雰囲気を伝えられるかもしれない。いや、PHPの悪評は知っているし、ガチでRをやっている人にとっては嫌がられることもわかっているけど、あえてそういう説明が、あくまで入り口としてはわかりやすいのではないかと。 どういうことかというのを言い訳します。 自分が読んだ感じだと、統計というのは、「何らかのデータ」と「分析するためのツールとしての数式」と「その数式が意図する
※適宜追加します 経済学 計量経済学 京大 末石直也 http://www.econ.kyoto-u.ac.jp/~sueishi/econometrics/econometrics.html 経済数学系資料 http://www.f.waseda.jp/ksuga/ 経済学のための位相数学の基礎とブラウワーの不動点定理 http://www2.chuo-u.ac.jp/keizaiken/discussno39.pdf 経済学のための最適化理論:講義ノート http://www.meijigakuin.ac.jp/~mashiyam/pdfdocs/optimization.pdf 経済学に必要な最適化理論 http://mediaislandr.org/pdf/static_optimization.pdf 経済学のための確率論入門 http://www.meijigakuin.ac.
コンビニ勢力地図2024-2025 三重にファミマが多くないか? このところ三重県と愛知県に行く機会が多かったのだが、車で国道を走ってるとやたらファミマを見る気がしていた。地域によってコンビニの種類に偏りがあるとは思っていたが、実際どうなのか。調べてみたのでお伝えしたい。 これが日本国…
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く