Wikipediaから、偶然短歌の体裁になっている文章を見つけ出してツイートするアカウント「偶然短歌bot(@g57577)」が、Twitterやはてなブックマークで注目を集めています。制作したのは、はてなユーザーのid:inaniwa_3さん。抽出作業ではWikipediaの日本語版を対象とし、オープンソースの形態素解析エンジンである「MeCab」を使用したそうです。
▽ 偶然短歌bot (@g57577) | Twitter
同アカウントは2014年12月29日から始まり、2015年1月19日午後3時30分時点で2万人以上にフォローされています。このアカウントを運営するid:inaniwa_3さんは「以前、誰か(たぶん nai さん)がツイートで偶然57577になっている文章を短歌として紹介していて、面白いなと思ったのがきっかけで作りました」とコメントしています。はてなブログでは、その経緯と作り方などを公開しています。
アルメニア、アゼルバイジャン、ウクライナ、中央アジア、およびシベリア #tanka
ウィキペディア日本語版「モロカン派」より http://t.co/SHfOLLIWud
— 偶然短歌bot (@g57577) 2015, 1月 12
▽ 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
作り方は、Wikipedia日本語版の最新の記事をダウンロードし、ソフトウェア「WP2TXT」で扱いやすい形式に変換。その後、オープンソースの形態素解析エンジン「MeCab」を使った自作のプログラムで、文章が5・7・5・7・7の短歌になっている文章を抽出します。最後に別のプログラムが、抽出したものから適当に選択してツイートするそうです。ツイートする頻度も、5・7・5・7・7時間おきという徹底ぶりです。
単純に文字数で抽出しても短歌になっていないものが多く、プログラムの修正を繰り返したそう。短歌そのものが載っていることもあり、手作業での修正も必要だったそうです。
西側にあったホームは撤去され、花壇に花が植えられている #tanka
ウィキペディア日本語版「三方駅」より http://t.co/YrOGEX1TSZ
— 偶然短歌bot (@g57577) 2015, 1月 15
このブログ記事のブックマークコメントや、偶然短歌botのツイートをまとめたTogetterページのブックマークコメントには、「俳句や短歌も、人が作るのではなく、アルゴリズムが作って人が選び出す時代が始まった感」「記事タイトルも短歌の形式」「リズムに乗ると無機質な文章ですらやや風流に」などの反応が集まっています。
▽ Wikipedia から短歌のリズム になった文 取り出すbotが 詩的で素敵 - Togetter
ちなみに、はてなブックマークで「タイトル五七五」と検索すると、ページのタイトルが川柳や短歌のようになっているものを見つけることができます。