Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

dataに関するnirvashのブックマーク (4)

  • 活字中毒R。

    『日は世界で第何位?』(岡崎大五著・新潮新書)より。 【一軒あたりの平均床面積(㎡)(世界の統計2006) 1位 アメリカ  162 2位 ルクセンブルク  126 3位 スロベニア    114 4位 デンマーク    109 5位 日       94.85 6位 オーストリア   92 7位 フランス     90 トルコ      90 8位 イギリス     87 9位 チェコ      84 10位 ポルトガル    83 以前、海外専門の駐在員をしていたころ、日人の客からちょくちょくクレームをもらった。これはヨーロッパならではのクレームである。いわく、 「床にスーツケースを開けて広げられないほど部屋が狭いのよ!」 「日人が小さいからって、わざと狭い部屋をあてがったりして」 「そりゃわたしたちは日人だもの、たしかにうさぎ小屋に住んでいるけど、海外に来てまでこんな仕打ち

    nirvash
    nirvash 2007/11/26
    なんだ、みんなウサギ小屋に住んでんじゃねえか。というかウサギに失礼だ。
  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • YouSendIt

    Get to Final faster. In-house or outsourced, anyone can join the collaboration. Collect feedback from multiple reviewers in one place, always on the latest version of the file. Share Files with Ease. Securely share large files with instant recipient email notifications, and know when your content has been accessed with file delivery and send tracking.

    YouSendIt
  • 1