since 2003-03-27, last update 2003-03-29 山下達雄 はじめに この文書の目的は、 「日本語 (EUC-JP) の処理を jperl や最新の perl や特別 なモジュールなしの環境でも安心して行えるようにするノウハウ」 の紹介です。 まあ、なんというか、バッドノウハウですね。 「過去に jperl で書かれたプログラム遺産をどうやって perl で動かすか?」という問題も解決するかもしれません。 例として、日本語の文切りを取り上げます。 問題 EUC-JP で書かれた日本語テキストファイルを仮定して、 「。」や「.」をヒントに自動的に文を区切るプログラムを考えます。 いきなりですが、昔あった jperl というのを使えば、 以下のようなプログラムを書くだけでおしまいです。めでたし、めでたし (プログラムも EUC-JP で書かれていると仮定します)