4. @mosa_siru • DeNA(2年目) • プラットフォーム API開発・運用 • ハッカドール 立ち上げからジョイン • サーバーAPI 設計・開発・運用(ほぼ全部) • フロント/バックエンド Web開発 • ログ設計・リコメンドシステムをうんうん考える • 社内の分析チームと密に連携 4
By Evan Miller February 6, 2009 (Changes) Translations: Dutch Estonian German Russian Ukrainian PROBLEM: You are a web programmer. You have users. Your users rate stuff on your site. You want to put the highest-rated stuff at the top and lowest-rated at the bottom. You need some sort of “score” to sort by. WRONG SOLUTION #1: Score = (Positive ratings) − (Negative ratings) Why it is wrong: Supp
“アルゴリズム”は、もっとも非人間的なものの代表だともいえる。ソーシャルメディアにとって、そのアルゴリズムが不可欠だというのは、実に皮肉めいている。 僕はこの間、グーグルがどうやってユーザーデータを集めているかについて書いた記事を掲載した(前編、後編)。今回は、著名なソーシャルメディアサイトが、ユーザーデータを活用する上でどのようにアルゴリズムを用いているのか、白日の下にさらそう。 ソーシャルメディアを成り立たせているのは人間の力だが、ユーザーが入力したデータを利用できる状態にする仕組みは、アルゴリズムによって作られている。現在活動している無数のソーシャルメディアサイトで実証済みのことだが、ユーザーの関与とアルゴリズムによる処理ルールの上手いバランスを見出すことは、とても難しくなりがちだ。これから紹介するアルゴリズムは、悪意のないユーザーと結びついて初めてうまくいくものだ。 人気ソーシャル
googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系の本は最近増えてきましたが、統計学自体が基礎から学べる本はまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =
先日、「情報推薦アルゴリズムの効果をどう評価するのか」という記事を書きましたが、各所から様々なフィードバックを頂きました。私の理解力が不十分なため、指摘を完全にまとめることはできないのですが、強く印象に残ったことについて書いてみようかと思います。 工学的立場からの研究にはよく見られるのですが、個人的には、そもそも情報科学の世界において、なんらかの「正解」や「客観評価」が存在するかのような前提を置くというのは、ありがちな誤解だと思っています。 情報科学における評価はヒトによる主観性評価しかありえず、そのように評価が行われてきたと認識しています。 (参照:http://d.hatena.ne.jp/kunimiya/20081223/p1#c1230090389) id:tmasao さんから頂いたご指摘です。 言われてみれば、その通りかもしれません。そもそも情報の価値というものが受け取る人に
以前このブログでも紹介した『集合知プログラミング』を読みつつ、細々とデータマイニングの勉強を続けているこの頃です。それに関連して情報推薦についての研究動向についても調べていたりしているのですが、そうしていくうちに疑問に感じることがありました。 それは、情報推薦アルゴリズムの有効性を正しく評価できるのか?ということです。アルゴリズムというと、素数の判定やソートなどが思い浮かびますが、その場合の有効性はいかに少ない時間で計算結果を出せるかという、定量的な尺度で評価することが可能です。しかし情報推薦の場合は効率性ではなくユーザーの明示化できない欲求に応えることという数値化しにくい目的であるので、果たしてそこで導入されるアルゴリズムの有効性はそもそも評価できるのだろうか?と思うのです。 情報検索のアルゴリズムの場合は、適合率と再現率の2つの尺度によって評価することができます。適合率とは「検索結果中
Vol. 47 No. 4 情報処理学会論文誌 Apr. 2006 嗜好抽出と情報推薦技術 土 方 嘉 徳† hogehoge. Techniques of Preference Extraction for Information Recommendation Yoshinori Hijikata† hoeghoge. 1. 嗜好抽出・情報推薦の現在 近年,ユーザの嗜好に応じた推薦サービスが注目を 集めている.特に,本や CD, ビデオなどを扱う世界最 大のオンラインショ ップに成長した Amazon.com☆1 の 影響が大きいと言える.Amazon.com では過去の購買 履歴やアンケートなどから,ユーザが好みそうな商品 を推薦してくれる.このような推薦サービスは,オン ラインショ ップにとどまらず,現在ではニュースのポー タルサイトにおけるニュース記事の推薦(MSN
推薦システムの 基本方式と技術展望 Recommendation Techniques and Future Research Theme 大阪大学大学院基礎工学研究科 土方 嘉徳 Graduate School of Engineering Science, Osaka University Yoshinori Hijikata (C) 2004-2010 Yoshinori Hijikata キーワード 推薦システム パーソナライゼーション 協調フィルタリング 嗜好抽出 Web視聴率調査 One-to-One Marketing ・・・ 1990年後半以降, アカデミア・産業界を 賑わし続けている 言葉ではあるが・・・ 技術の体系化は出遅れ (C) 2004-2010 Yoshinori Hijikata 推薦システムの歴史 1980年代後半 インターネットプロト コルを
1 ¤ ✞ ✝解 説 ✆ 情報推薦・情報フィルタリングのための ユーザプロファイリング技術 User Profiling Technique for Information Recommendation and Information Filtering 土方 嘉徳 大阪大学大学院基礎工学研究科 Graduate School of Engineering Science, Osaka University Yoshinori Hijikata hijikata@sys.es.osaka-u.ac.jp, http://www.nishilab.sys.es.osaka-u.ac.jp/people/hijikata/index.html keywords: user profiling, information filtering, recommender system, relev
自己紹介 d:id:gnarl twitter:todesking いちおう情報系 興味 プログラミング言語処理系 ソフトウェア・アーキテクチャ(オブジェクト指向設計とか) 機械学習(ニワカ) 推薦エンジンを作ってるチームに所属してます 最近の仕事: javaでニュース記事の特徴語を解析して云々 ruby+sinatraでなんかつくる仕事 アジェンダ(1) 推薦システムとはなにか 推薦システムの種類 コンテンツベース、行動ベース ユーザ-アイテム、アイテム-アイテム モデルベース、メモリベース この辺の話は皆さんのほうが専門家ですね…… 省略します アジェンダ(2) 推薦システムの精度をはかる MAE/RMSE Precision, Recall 推薦システムの抱える問題点 スパースネスの問題 コールドスタートの問題 この辺の話を長々とすると会場の研究者にしらけた顔をされる…… 省略します
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く