[B! grep] sylvan_lのブックマーク

sylvan_l id:sylvan_l

grepに関するsylvan_lのブックマーク (3)

wgetでHTMLのリンク切れをざっくりあぶり出すワンライナー - Do You PHP はてブロ
via. http://www.math.kobe-u.ac.jp/~kodama/tips-ruby-check-link.html もうちょっとうまい方法ありそうだなぁと思いつつ、こんな感じで。 LC_ALL=C wget -nv --delete-after -m -k -p http://example.com/ &> tmp.log; grep -B1 "ERROR 404" tmp.log | grep http | sed -e "s/:$//g" なんで一度tmp.logに落としてるかというと、上のコマンドだと「リンク先」を抽出するだけなので、その「リンク元」を調べるためです。リンク元*候補*のざっくりした抽出は、リンク切れになったURLを使って、次のような感じで。まあ、『エラーになったURL』が呼び出される前の5つのURLを表示するだけなんですが。 grep -i ht
sylvan_l 2010/08/15
link切れをさがすコマンド

wget

grep
リンク
find／grep／xargsコマンドを使いこなす　業務で楽するためのUNIXテクニック集「検索」編
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。
sylvan_l 2008/12/10
find の使い方

linux

find

grep
リンク
文字エンコーディングが仲間外れのファイルを素早く見つける方法
プロジェクトに多人数が参加するようになると、なぜかプロジェクトの標準とは異なる文字エンコーディングのファイルがcommitされていることがあります。UTF-8で統一しているはずなのにShift_JISのファイルがある、なんて場合ですね。そこでメンバーの注意力不足を指摘したり、「だから＊＊＊（自分の使っていないエディタの名前を入れてください）はダメなんだ」とかいう宗教論争に発展させたりというのでは不毛ですよね。簡単に気づく方法があればそれでいいんですよ。方法は色々あると思いますが、今日はどこのご家庭にも必ずあるnkfを使ってみましょう。最近のnkfには--guessというオプションがあり、文字エンコーディングを推測してくれます。 $ nkf --guess hoge*.txt hoge1.txt:EUC-JP (LF) hoge2.txt:UTF-8 (LF) hoge3.txt:B
sylvan_l 2008/11/25
linux

find

grep

php
リンク
1