Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

siteinfoに関するYAAのブックマーク (6)

  • Wedataのiview用データベースSITEINFO仕様 « ku

    そのデータベース: iview - wedataの今のところの仕様です。 はじめに iviewはAutoPagerizeやLDRizeがやっているのと同じように、HTMLページを読み込んで、その中にある写真や説明文をXPathで取り出して表示しています。そのページの写真を全部表示し終えると、AutoPagerizeのようにXPathで表された次のページへのリンクをたどり、そのページの中にある写真を表示していきます。 サイト構造の分類と定義 データベースの各項目の意味を説明する前に、一般的な写真サイトのHTML構造について3種類分類します。多くのサイトは、以下で述べる3種類の構造のどれかに当てはまります。 たいていの写真サイトは、写真に限らず大量のコンテンツを管理しているサイトがそうしているように、ひとつのページにすべての写真を表示したりはせず、それらをたくさんのページに分割して表示していま

  • HTML::Feature::Engine::LDRFullFeed - WedataにあるLDR Full FeedのSITEINFOを使ってWebページの本文を抽出するPerlモジュール - fubaはてな

    LDR Full FeedのSITEINFOがWedataに移動して便利になったので、そろそろHTML::Featureのエンジンが必要だと思って書いてみた。HTML::FeatureについてはHTML::Feature - 重要部分を抽出するモジュール - - download_takeshi’s diaryを、エンジンの拡張についてはHTML::Featureはエンジンをいろいろ拡張できるよ! - download_takeshi’s diaryを参照ください。 HTML::Feature::Engine::LDRFullFeed koyachiさんのWebService::Wedataを使ってWedataからSITEINFOを取得、そのSITEINFOをpriority順にソートして、最初にURLがマッチしたSITEINFOのXPathHTML::Elementをとってくるという仕

    HTML::Feature::Engine::LDRFullFeed - WedataにあるLDR Full FeedのSITEINFOを使ってWebページの本文を抽出するPerlモジュール - fubaはてな
  • wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector - bits and bytes

    wedata対応バージョンのSITEINFO作成用Firefox拡張機能 AutoPagerize Iteration Detector HTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorをwedataに対応させました。AutoPagerize Iteration Detectorで作ったSITEINFOを直接wedataに反映させられるようになっています。 インストール iterd.xpi(supports Firefox 2.0-3.0.0.*) つかいかた 使い方はwedataに接続する部分以外以前のバージョンとかわっていませんが、ざっと紹介します。 次のページへのリンクを右クリックする SITEINFOを作りたいページを開いて、ページの中にある次のページへのリンクを右クリックします。メニューの中に

  • wedata.net公開 - SWDYH

    wedataというサービスを作りました。 wedataはSITEINFOなど、誰でも書換えられるデータを保存して利用するためのシステムです。 AutoPagarizeのSITEINFOやそれ系のデータを保存する場所として使えればいいなあと思ってつくりました。 AutoPagerizeのSITEINFOは、今日からinfogamiからwedataに移転します。 wedataはSITEINFOに限らず、わりと汎用的に使えてAPIもあるので、興味あるひとはぜひを使ってみてください。 wedata http://wedata.net/

    wedata.net公開 - SWDYH
  • いきおい余ってautopagerizeのsiteinfoをjottit.comに貼ってみた! - 天下泰平 The Whole World is peaceful.

    autopagerizeのsiteinfoってjottit.comとかに移設できないのかなー。 行数が多いのでページ分る必要があるかも。アルファベット順とか。 でも分るとダブって書く可能性があるよなー。一枚っぴらがいいのかなー。 そもそも、siteinfo置き場をプライマリ/セカンダリ的に用意するようなことは出来無いんだろーか。あっちがなかったらコッチみたいな。 それと、サーバにおいてあるsiteinfoとuser.jsに書くsiteinfoは優先度はどっちのほうが高いんだろー。ローカルであってほしいなー。user.jsを見ればわかるんだろーか。 コピーして貼ってみるか!!! 追記:いきおい余って貼ってみた! http://jottit.com/yzkqj/ 編集のときに、すげー遅いのだ。プレビューに時間がかかってる。 そんでもって、<textarea> をつかってるんだけど、ひじょうーに

    いきおい余ってautopagerizeのsiteinfoをjottit.comに貼ってみた! - 天下泰平 The Whole World is peaceful.
  • siteinfo writing

    SITEINFOの書き方入門 SITEINFOは次のページへのリンクがどれかを示すnextLinkと、ページの中の文部分を示すpageElementとでできています。 nextLinkは複数にマッチするXPathでも大丈夫です。複数の要素にマッチするときは、一番はじめにマッチしたものが使われます。よくページの上部と下部に同じナビゲーションが入っているページがありますが、そのときも片方だけの次のページへのリンクにマッチするようにXpathを書かなくてもAutoPagerizeがマッチしたものの中で一番はじめのものを使ってくれます。(実装はそうなってるけど仕様としてどうなのかは知らない) AutoPagerizeのSITEINFOと同様な仕組みはLDRizeやLDR Full Entryでも用いられているので、書けるようになると他のところでも役に立ちますよ。他にもまじめにXSLTでバリバリ使

  • 1