2006-03-01から1ヶ月間の記事一覧
rubyco さんのところで、String#each_char って便利じゃない?って話が出ています。 これはすでにjcode.rbに存在しますね。組み込みにしようよと、まつもとさんに提案したこともあります。って、ここで String#each_char は HEAD に入れますとあるのに今も入…
artonさんの出題と解答例とか。以下のような解き方もおもしろいかな。もちろんUTF-8決め打ちならkconv不要。 require'kconv' "日本語".toutf8.unpack('U*').sizeArray#injectは凄い便利なので、artonさんのString#char_countも以下のように書き換えられます…
弾さんのところにUTF-8 vs. ISO-10646というentryが。PerlではルーズなUTF-8のことをutf8と読んでましたね。 というわけで、UTF-8 の文字にマッチする正規表現という話。蛇足になりますけれど、もっと厳密にしますと、最短でないUTF-8表現を除外できるので、…