関数を利用したXPath式 「XPath」は、 既に昔の正規表現によるHTMLからの情報抽出を形骸化させるほどに流行っています。 ネット上にも、XPathを紹介しているページが沢山ありますが、ここでは、 普段あまりネット上で見ないXPathの関数を使って、 より強力なXPath式を紹介したいと思います。 レファレンス テキストノードではなくテキストを取り出す perlでいうtrを、XPathで使う テキストを X 文字以上含む要素の取り出す 特定の拡張子を持つリンクのみを取り出す まとめ テキストノードではなくテキストを取り出す 使用する関数の紹介 Function: string string(object?) (example) string(id('hoge')) = id が hoge の要素内のテキストを返す 案外知られてないですが、要素内にあるテキストをそのまま文字列の形で取り