Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

twitterとstreamに関するjazzanovaのブックマーク (2)

  • 140行で作る分散リアルタイム検索エンジン(Twitter Streaming API対応) - 古橋貞之の日記

    マトモに使えるRPCライブラリ MessagePack-RPC for Ruby のバージョン 0.2.0 をリリースしました! 新たにコネクションプーリングの機能を追加しました。一度接続したコネクションを共有して使い回すことができます。コネクションを何度も張り直す負荷と遅延を削減でき、リソースの消費も抑えられます。 また、不意に切断されたコネクションを自動的に再接続する機能を導入し、信頼性を向上させています。 これを使って何か作ってみようと言うことで、twitterのリアルタイム検索エンジンを作ってみました。日語を検索できないなど機能は貧弱ですが、プログラム全体がわずか140行に収まっています(クローラ27行、インデクサ48行、クラスタ管理ノード37行、検索クライアント28行)。 新しいつぶやきを受信するたびに、リアルタイムで転置インデックスを作成していきます。インデックスを作成するノ

    140行で作る分散リアルタイム検索エンジン(Twitter Streaming API対応) - 古橋貞之の日記
  • Twitter Streaming API を gardenhose レベルで利用する - nobu-qの日記

    id:awakia に教えて貰いました。 Twitter Streaming API の sample を使うと、正確に確認したわけではありませんが、全発言の1/20を取得できます。やってみると分かりますが、この1/20というのは結構シビアで、全然自分の発言が拾われません。秘宝伝の高確での解除率が1/16.8だから、それより悪かったら引ける気がしませんよね。何でもないですすいませんでした。 余談ですが、全発言の1/20というのは、具体的には発言IDの下二桁が特定の数字である発言のみが拾えるということです。自分のところだと確認した限りでは04〜08でしたが、もしかしたら環境によって変わるかも知れません。まあ、100個中5個しか拾えないということですね。 そんなわけで、通常の sample はもの凄くショボイのですが、そのしょぼさをちょっとだけ改善できるのが gardenhose です。正確に

    Twitter Streaming API を gardenhose レベルで利用する - nobu-qの日記
  • 1