Colibri: Fast Mining of Large Static and Dynamic Graphs Hanghang Tong Carnegie Mellon University Pittsburgh, PA, USA htong@cs.cmu.edu Spiros Papadimitriou IBM T.J. Watson Hawthorne, NY, USA spapadim@us.ibm.com Jimeng Sun IBM T.J. Watson Hawthorne, NY, USA jimeng@us.ibm.com Philip S. Yu University of Illinois at Chicago Chicago, IL, USA psyu@cs.uic.edu Christos Faloutsos Carnegie Mellon University
Large graph mining: patterns, tools and case studies Tutorial proposal for CIKM 2008, Napa Valley, California Christos Faloutsos and Hanghang Tong, Carnegie Mellon University Abstract How do graphs look like? How do they evolve over time? How can we find patterns, anomalies and regularities in them? How to find influential nodes in the network? We will present both theoretical results and algorith
id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどの本を買ったかとか、推薦エンジンで使う行列)、ページ-リンク行列(どのページからどのページにリンクが出ているか、もしくはリンクをもらっているか。PageRank などページのランキングの計算に使う)、といったような行列を計算するとき、大規模行列だと計算量・記憶スペースともに膨大なので、事前にある程度計算しておけるのであれば、できるだけ小さくしておきたい(そして可能ならば精度も上げたい)、という手法である。 行列の圧縮には元の行列を A (m行n列)とすると A = USV^T というように3つに分解することが多いが、も
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く