[B! html][database] tsupoのブックマーク

tsupo id:tsupo

htmlとdatabaseに関するtsupoのブックマーク (2)

進化する“Webスクレイピング”技術の世界 ― ＠IT
2007/02/20 WebサービスのAPIやRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogle、Yahoo!、楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLやCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング”技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ
tsupo 2007/02/20
Webの世界全体がそうした“フレンドリーな世界”になるのは、楽観的に見てもWeb88.0になるころではないか // HTree で整形式のXHTMLにして Hpricot で抜き出す

scraping

scRUBYt

html

dataBase

XPath

XML

Mechanize

Hpricot

Internet

computer
リンク
〈 SL 〉: もう XML 言語を開発するな
Wednesday, January 11, 2006 もう XML 言語を開発するな Don’t Invent XML Languages by Tim Bray (Updated: 2006/01/09) XML の X は「拡張可能(Extensible)」という意味だ。自分の問題に応じて自分の XML 言語を開発できることをウリにしている。でも、僕は過去 2 、3 年の経験から、そうすべきではないことを悟った。本当に必要な時以外はね。今からそれを説明する。そして、もし本当に必要な時がくれば、関連文書のOn XML Language Design を読んで欲しい。僕は最近ある XML 言語の開発を手伝っていたのだけれど、どうか話半分で聞いて欲しい。僕は言語デザインをメインでやっているわけではないし、僕がもし専門技術でなにか言えることがあるとすれば、それは主としてたくさんの異なる X
tsupo 2006/01/30
切実 (^^;

XML

scheme

Atom

PDF

html

microformats

database
リンク
1

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

はてなブックマーク

タグ

関連タグで絞り込む (13)

htmlとdatabaseに関するtsupoのブックマーク (2)

お知らせ

【復旧済】「マイホットエントリー」「お気に入り」「関心ワード」が利用できない障害が発生していました

今週のはてなブックマーク数ランキング（2025年1月第3週）

今週のはてなブックマーク数ランキング（2025年1月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (13)

htmlとdatabaseに関するtsupoのブックマーク (2)

進化する“Webスクレイピング”技術の世界 ― ＠IT

〈 SL 〉: もう XML 言語を開発するな

お知らせ

【復旧済】「マイホットエントリー」「お気に入り」「関心ワード」が利用できない障害が発生していました

今週のはてなブックマーク数ランキング（2025年1月第3週）

今週のはてなブックマーク数ランキング（2025年1月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス