robots.txt とかも自分で一度は目を通しておこうね。 さて、以前の日記で気象庁の各日の震源データが消えていると思ったら見つかりました~ってのを書きました。 niszet.hatenablog.com 今回はそのページからデータを取ってくる作業をします。手作業でも良いかなと思ったらこれは日毎にページが分かれているわけですね~。流石にこれを手でやるのはちょっとシンドイので、久々にスクレイピングでやっつけます。 丁度良いことに、昨年末のJapan.R 2020にてwatagusaさんのLT、「"polite"で守るWebスクレイピングのエチケット」でpoliteパッケージの存在を知ったので、これを参考にしてやってみました。 Japan.Rのページはこちら japanr.connpass.com また、LTの内容ついてはwatagusaさんのブログにまとまってます。 watagusa.ha