ハッカーニュース人気言語
「好きな言語は?」というアンケートのページ http://news.ycombinator.com/item?id=3746692 から。
Actionscript
Ada
Assembly
C
C++
C#
Clojure
Cobol
CoffeeScript
ColdFusion
D
Delphi
Erlang
Forth
Fortran
Haskell
Java
JavaScript
Lisp
Lua
Objective C
OCaml
Pascal
Perl
PHP
Python
Rexx
Ruby
Scala
Scheme
Shell
Smalltalk
SQL
Tcl
Visual Basic
Other
Groovy
グラフはこんなコマンドで生成
w3m -dump 'http://news.ycombinator.com/item?id=3746692' \
sed -n '/Please up vote this poll to keep it alive./,/\[ *\]/p' \ | |||
grep -v 'Please up vote this poll to keep it alive.' \ | |||
grep -v '^ *\[ *\] *$' \ | |||
sed 's/\[grayarrow\]//' \ | |||
sed 's | \([0-9][0-9]*\) points | <span style="width:\1px; height: 1em; background:#cceecc; border: 1px solid #000; display: inline-block" ></span><br/> | ' \ |
sed 's | ^ *\([^<]*\) | <span style="width:50; display: inline-block; white-space:nowrap;">\1</span> | ' \ |
sed 's/(.*)//' \ | |||
tee x.html |
awkによる実装: http://gauc.no-ip.org/awk-users-jp/blis.cgi/DoukakuAWK_308
bashによる実装 http://d.hatena.ne.jp/labunix/20120324
こういうスクレーピングはphantomjsでjqueryとか使ってやるのが近代的な手段なんだろう。ウェブのスクレープはウェブ技術でやるのがいいにきまっている。しかし、grep,sed,awkなどのコマンドは常に手元になるのでついそっちにいってしまう。ウェブで育った人達にはJavaScriptでウェブツールを操作する方が自然なのかもしれない。