タグ

2009年10月18日のブックマーク (6件)

  • JavaScriptで本文抽出·ExtractContentJS MOONGIFT

    ExtractContentJSはJavaScript製のオープンソース・ソフトウェア。ブログやWebサイトのデータを集積して、そこから情報を吸い出して何らかのサイトを構築するというサービスは多い。その時重要になるのが特定URLからの文抽出だ。サイドバーやヘッダーなど余計な情報を省くことでより意味のあるコンテンツが得られるようになる。 画面下の文字列が文抽出した結果 Rubyであれば以前紹介したExtractcontentというライブラリがある。そしてそれをベースのはてなにてJavaScript実装したのがExtractContentJSだ。JavaScriptベースの実装とあって、クライアントベースで抽出を行いたいという時に使えそうなライブラリだ。 使い方は簡単で、ExtractContentJSのオブジェクトを作ったら現在表示されているページのオブジェクト(document)を渡す

    JavaScriptで本文抽出·ExtractContentJS MOONGIFT
    HHR
    HHR 2009/10/18
    RubyのJS版
  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

    HHR
    HHR 2009/10/18
  • Accueil

    Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considérerons que vous acceptez l'utilisation des cookies.Ok

  • 今使っているWindowsを仮想化する·Disk2vhd MOONGIFT

    Disk2vhdはWindows向けのフリーウェア。今は仮想化が流行だ。筆者もWindowsMac OSXの仮想化ソフトウェア上で動作しているし、MOONGIFTはAmazon EC2上で1年半近くノンストップで運営されている。ハードウェアのリソースがあまりがちな現在、その有効活用の上でも仮想化は便利な技術だ。だが最も面倒なのは環境の準備かも知れない。 ドライブを選択するだけ 開発やテストで現状の環境をそのまま使うとリストアが大変になる。そこで使いたいのがDisk2vhdだ。Disk2vhdは現状のハードディスクのスナップショットを取得し、マイクロソフトが無償で提供するVirtualPC向けのハードディスクイメージするソフトウェアだ。 使い方は簡単で、起動したらリストアップされているドライブを選択してCreateボタンを押すだけだ。後はあらかじめ指定したフォルダにディスクイメージを保存す

    今使っているWindowsを仮想化する·Disk2vhd MOONGIFT
    HHR
    HHR 2009/10/18
    VirtualPC向けのハードディスクイメージを作成する
  • 簡易画像編集もできるバグ報告用スクリーンショットツール·Bug Shooting MOONGIFT

    Bug ShootingはWindows向けのフリーウェア。システム開発においてテストは重要なステップだ。そしてテストにおいてバグ報告の仕方は大事だ。分かりやすい報告をすれば修正も早い。ただ文字だけで説明するよりも、スクリーンショットがあった方が分かりやすいだろう。 設定画面。各種BTSに対応 Windowsでスクリーンショットを撮って報告に使おうと思うと意外と面倒くさい。PrintScreenを押して、ペイントなどに貼付けておかしい部分が分かるように加工して保存する。そしてバグトラッキングソフトウェアなどに添付するのだ。これはあまりに面倒くさい。 そこで使いたいのがBug Shootingだ。Bug ShootingはWindows向けのスクリーンショット撮影ソフトウェアで、撮影したスクリーンショットを加工するエディターがついている。それも報告しやすいようなマーカーや矢印、文字を追加する

    簡易画像編集もできるバグ報告用スクリーンショットツール·Bug Shooting MOONGIFT
    HHR
    HHR 2009/10/18
    スクリーンショット
  • CodeMirror

    Extensible Code Editor CodeMirror is a code editor component for the web. It can be used in websites to implement a text input field with support for many editing features, and has a rich programming interface to allow further extension. This is a CodeMirror field, configured for editing JavaScript code. Features Accessibility Works well with screen readers and keyboard-only users. Mobile Support

    HHR
    HHR 2009/10/18
    HTMLのテキストエリアでコーディング