#前に社内wikiに書いておいたのを公開してみるテスト。 Catalystでマルチバイトを扱う機会があるのは主に ユーザーがフォームで入力する値 ($c->req->param()) データベースからの入出力 (DBIx::Class) それ以外の文字列の評価 View::TTによる出力の生成 FillInFormによるフォームの埋め込み HTTPレスポンス です。 ここでは以下の条件でまとめてみました。 文字コードはUTF8に統一 データベースにはmysqlを使用 下準備 テンプレート、perlのコードは全てUTF8で書きます。 mysqlの文字コードの指定は/etc/my.cnfに [mysqld] default-character-set = utf8 skip-character-set-client-handshake [mysql] default-character-set
Text::MeCab::Dictでカスタム辞書 ちょっとリリースそのものでバタバタしてしまいましたが、Text::MeCabを使って、mecabのカスタム辞書に語句を比較的容易に追加できるようにしました。例はText::MeCab 0.20004に同梱されているeg/add_custom.plを参照してください。 自分の場合はちょっと人名をがばっと追加したかったのでAcme::Actor::JA(codereposのみ -- CPANにはアップしてません)とText::MeCab::Dictを使って3000人程の人名を追加してやりました。これをすると何がいいかというと、これまでだとものすごく有名な人の名前で検索する場合とかに「姓」「名」に名前が分けられてしまっていたところがその名前全体をひとつの語句として認識してくれるようになります。 # 追加前 shell > 堂本光一 堂本 名詞,
珍しく数十件の同一スレ投稿があってびっくりしました。数十名の方thx。 1 :以下、名無しにかわりましてVIPがお送りします。:2008/01/10(木) 03:16:26.71 ID:r7Iz4ybN0 まぁ、まずことの始まりなんだが俺はネカフェ難民だったんだ 4 :以下、名無しにかわりましてVIPがお送りします。:2008/01/10(木) 03:17:24.92 ID:jakzBLf40 それも妄想ってオチだろ?もう、そうかよって突っ込みたいよ 6 :以下、名無しにかわりましてVIPがお送りします。:2008/01/10(木) 03:21:06.00 ID:r7Iz4ybN0 結構前に仕事をやめたんだが、それから次が思うようにいかなかった 気が付くと貯蓄額がどんどん減ってしまっている 住んでいたところも出ることになってしまった で、そのまんま俺はネカフェ難民になって派遣とかしながらや
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く