Code Archive Skip to content Google About Google Privacy Terms
greeさんで開催されたKey Value Store勉強会に行ってきました。 時間にして4時間超え、内容も国内のKey-Value Storeなソフトウェアの最前線の話ばかりで相当なボリューム。以下、メモってたのを残しておきたいと思います。(誤字、脱字、内容に誤りを含むものなどありましたらお伝えください)また、発表者の方やプロダクトについて、ざっくり調べてURL見つけられたものについてはリンク張っています。 森さん / 末永さん groonga Sennaの後継エンジン 融通が効かないのがSennaのデメリット スコア算出式のカスタマイズなど Sennaの転置索引 索引の構成部品を自由に組み合わせて使える APIもいろいろ QL DB Low Level memcached互換のkey-value store バイナリのみ対応 計測 クライアント memstorm-0.6.8 mem
正月早々インフルエンザにかかって寝込んだmikioです。電車に乗る時や繁華街などに出る時はマスク着用が必須ですね。さて今回は、Tokyo Cabinetで実装したテーブル方式のデータベースについて紹介します。意外にどうして強力な機能なので、このネタは連載することを予告します。 テーブルデータベースとは 簡単に言えば、リレーショナルデータベースのテーブルのように、複数の列からなるレコードを格納できるデータベースです。SQLや表結合などの複雑な機能はサポートしませんが、そのぶん高速に動作します。つまり、DBMの速度で動くリレーショナル風データベースです(厳密にはリレーショナルデータベースではありません)。 TCの基本となるハッシュデータベースは、単純なkey/value型のデータベースであり、つまりキーにも値にもスカラ(数値や文字列などの特に構造を持たない単一の値)しか格納することはできません
OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日本語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日本語表示してくれる。日本語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
Firefox3beta5のGreasemonkeyでGM_xmlhttpRequest使うときにBASIC認証ダイアログが出ない件の回避方法 - 0xFF関連。 ちょうどこの件の回答がXHR auth (Was: Greasemonkey 0.8 Release Candidate) - greasemonkey-dev | Google グループに投稿された。 Firefox3だとGM_xmlhttpRequestしたとき認証ダイアログでないんだけどー?って質問に、Greasemonkeyの問題じゃなくて一般的な変更による影響で。chrome特権なXMLHttpRequestはデフォルトでバックグラウンド処理で実行されるようになったんだよー。と。 詳細は、 XMLHttpRequest | MDN 383430 – Add API to XMLHttpRequest to provid
Firefox3 の Greasemonkey, unsafeWindow 内の prototype がとれない - 冬通りに消え行く制服ガールは✖夢物語にリアルを求めない。 - subtechの件。 そろそろGreasemonkeyをFirefox3対応にしていきたいところだけど、この問題がすごく厄介。 例えば、はてなスターの星をプロフィールアイコンに置き換えるGreasemonkey Scriptメンテナンス更新 - 0xFFはFirefox2では動くけどFirefox3では動かない。 とりあえず、無理やり動かしてみる。 // ==UserScript== // @name replace star by profile icon // @namespace http://ss-o.net/ // @include http://*.hatena.ne.jp/* // @checkur
http://wedata.net/ http://search.cpan.org/dist/WebService-Wedata/ (2008-06-04 追記) http://buffr.org/tmp/wedata/WebService-Wedata-v0.0.4.tar.gz APIキーが必要なのでインストール時のテストは動かないようにしてますがt/01*.api_basic*.t.skipの内容のようにwedataに対して一通りCRUDできます。単純にAutopagerizeのSITECONFIG移動先として見られがちですが、OpenID使えるような人に編集してもらいたい既存データがある場合にも、wedataはAPIがあるので簡単に移動/編集できていいと思います。 以下はsynopsisから新規データベース/アイテムの追加と更新の抜粋。 use WebService::Wedata
AutoPagerize – Userscripts.org http://userscripts.org/scripts/show/8551 SITEINFOの置き場所をinfogamiからwedataへ移し、wedataからデータを取得するようにしました。 AutoPagerize 0.0.26以前のバージョンは、infogamiからデータを読むようになっているので、 できるだけアップデートしてください。 今後、SITEINFOを追加したり編集したりする場合はwedataの方でお願いします。 ログインがOpendIDになったり、個別に編集できたり、検索できたり、 APIがあったり、いろいろ便利になってると思います。 AutoPagerize - wedata http://wedata.net/databases/AutoPagerize/items
今日は、徳島大学の石田基広先生が開発されたRMeCabというRのパッケージを、ご紹介いたします。 RMeCabは、データ解析・グラフィックス環境Rから日本語形態素解析ソフトMeCabを呼び出して使うインターフェイス(フリーウェア)。他のRパッケージと同様に、Windowsだけでなく、MacやLinuxなどのOSでも使用可能。 ものすごく短い期間でバージョンアップされていますが、2008年4月7日現在でRMeCab_0.46が最新版。このバージョンに搭載されている主な機能は、文章の形態素解析、頻度表の作成、品詞指定での頻度表の作成、n-gram、コロケーションの抽出(T、MI、Gなどのスコアを表示)など。勿論、R上で処理しているので、既存の関数などを組み合わせていけば、様々な解析や視覚化が可能。 詳しい情報は、コチラ → http://cms.ias.tokushima-u.ac.jp
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く