perlで書いてみた。まだまだ適用されてるページのサンプルが少ないから変更の必要あると思う。タグ+クラス名を[h3,null]以外のサンプルを見つけられて無いのでとりあえずデフォルト固定パターンにしている。ブログによってカテゴリとかコメント欄へのリンクのパターンがさまざまなのでそれを削除する必要もある。 #!/usr/bin/env perl use strict; use warnings; use LWP::UserAgent; use HTML::TreeBuilder::XPath; use Encode; use Encode::Detect; #my $url = 'http://d.hatena.ne.jp/jkondo/'; #my $url = 'http://unknownplace.org/memo/'; my $url = 'http://blog.yappo.jp