タグ

ブックマーク / shuyo.hatenablog.com (5)

  • 言語判定のモデルパラメータを自己組織化マップで可視化 - 木曜不足

    サイボウズでも巷の流行りに乗っかって、アドベントカレンダーなるものをやってて、担当した記事が今日公開された。 言語判定の仕組み - Cybozu Inside Out | サイボウズエンジニアのブログ 通常のアドベントカレンダーと違って、テーマは「技術ならなんでも」って広すぎるやろー。というわけで言語処理な人には当たり前で、それ以外の人にはおそらく興味がないという、なかなかニッチな記事に(よく言えば)。 当は「なるほど、わからん」と言ってもらえるような記事が書きたくて、いくつかネタ候補を用意したんだけど、ことごとく自らボツに。実は先週の Kneser-Ney perplexity 記事もそんなボツネタの1つ。あの記事を一般技術者向けの Cybozu Inside Out に書いてみるという誘惑もあったんだけどねw 他にも ldig のパラメータを可視化して遊んでみるというネタもあって、こ

    言語判定のモデルパラメータを自己組織化マップで可視化 - 木曜不足
    nilab
    nilab 2015/10/19
    言語判定のモデルパラメータを自己組織化マップで可視化 - Mi manca qualche giovedi`?
  • URI Templates の各言語実装 - Mi manca qualche giovedi`?

    今日は第3回 RESTful 読書会だった。主催の id:kunit さん&nsiena さん、担当の方々、参加者の皆さんお疲れ様でした〜。 読書会の模様(特に8章の DIS られっぷり)はまた今度まとめるとして。 この前 URI Templates ( http://bitworking.org/projects/URI-Templates/ ) の各言語の実装を調べたよと読書会で話したら、id:t-wada さんに「調査結果が addressable になるといいなーw」とリクエストされたので、早速宿題をやっつけておく。 URI Templates の実装一覧 家 (experimental implementation in Python、 59:04+09:00">draft-03相当):http://code.google.com/p/uri-templates/ Ruby -

    URI Templates の各言語実装 - Mi manca qualche giovedi`?
    nilab
    nilab 2012/07/12
    URI Templates の各言語実装 - Mi manca qualche giovedi`?
  • ツイートの表現を正規化(Cooooooooooooooollllllllllllll => cool) - 木曜不足

    EMNLP 2011 でひときわ目を引くタイトル "Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! Using Word Lengthening to Detect Sentiment in Microblogs" (Brody & Diakopoulos) は、twitter 上での表現を評判分析に使う話。 Cooooooooooooooollllllllllllll のような文字を必要以上に繰り返す twitter でよくみる表現に注目して、このような表現が意見や評価を述べるときによく使われるという点を主張しているのがポイント。 まあ直感的にもうなずける分析だと思う。 論文の中では、そのためにまず Cooooooooooooooollllllllllllll -> cool のように正規化を行っている。 提案されている手法がとてもシンプルでおも

    ツイートの表現を正規化(Cooooooooooooooollllllllllllll => cool) - 木曜不足
    nilab
    nilab 2011/09/15
    「同じ文字の繰り返しを全て 1 文字につぶした圧縮形を作る(niiiice -> nice, reallllly -> realy)」ツイートの表現を正規化(Cooooooooooooooollllllllllllll => cool) - Mi manca qualche giovedi`?
  • WebDB Forum 2010 で「国際化時代の40カ国語言語判定」を発表しました #webdbf2010 - 木曜不足

    11月11〜12日に早稲田大学 理工学院にて行われた Webとデータベースに関するフォーラム (WebDB Forum 2010) に参加してきました。 サイボウズがフォーラムのシルバースポンサーを務めており、そちらの関係から 12日の技術報告セッションにおいて「国際化時代の40カ国語言語判定」と題し、以前開発したオープンソースの言語判定ライブラリについて発表させていただきました。 発表に用いましたプレゼンテーション資料はこちらです。*1 発表時は口頭で加えていた注釈のいくつかを追加してあります。 国際化時代の40カ国語言語判定 from Shuyo Nakatani なお、ご紹介した言語判定ライブラリ for Java はこちらです。 Google Code Archive - Long-term storage for Google Code Project Hosting. lan

    WebDB Forum 2010 で「国際化時代の40カ国語言語判定」を発表しました #webdbf2010 - 木曜不足
    nilab
    nilab 2010/11/15
    Language-Detection Project、言語判定ライブラリ for Java、ナイーブベイズ、特徴量に文字n-gramを使う / WebDB Forum 2010 で「国際化時代の40カ国語言語判定」を発表しました #webdbf2010 - Mi manca qualche giovedi`?
  • PlaceEngineマッシュアップの「お散歩ろぐ」を公開 - 木曜不足

    PlaceEngine を使った「お散歩ろぐ」というアプリケーションを公開しました。 お散歩ろぐ http://www.giovedi.net/sampolog/ 「お散歩ろぐ」はお出かけ先でインターネットに接続していなくても使える、位置と簡単なメモを記録していくツールです。 お出かけ前に PlaceEngine をあらかじめインストール&起動し、このページを開いておいてください。 外出先で散歩の追加をクリックすると、現在位置を測位し、画面上に日時とテキストメモ記入欄が作成されます。このときはインターネットに接続されている必要はありません。散歩の追加は繰り返し行うことができます。 帰宅後、インターネットに接続してから地図の表示をクリックすると、「散歩の追加」を行なってきた地点がそれぞれ地図として表示されます。このとき、外出先で集めてきた測位の結果をPlaceEngineサーバに送って緯度経

    PlaceEngineマッシュアップの「お散歩ろぐ」を公開 - 木曜不足
    nilab
    nilab 2007/03/12
    Mi manca qualche giovedi`? - PlaceEngineマッシュアップの「お散歩ろぐ」を公開
  • 1