タグ

encodingに関するaroma_blackのブックマーク (5)

  • codecs — Codec registry and base classes

    codecs — Codec registry and base classes¶ Source code: Lib/codecs.py This module defines base classes for standard Python codecs (encoders and decoders) and provides access to the internal Python codec registry, which manages the codec and error handling lookup process. Most standard codecs are text encodings, which encode text to bytes (and decode bytes to text), but there are also codecs provide

    codecs — Codec registry and base classes
  • 東アジアの文字幅 - Wikipedia

    この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2017年4月) 独自研究が含まれているおそれがあります。(2017年4月) 出典検索?: "東アジアの文字幅" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 「東アジアの文字幅」(英: East Asian Width)は、Unicode標準の附属書 (英: Unicode Standard Annex) の一つ。Unicodeに収録されている各文字の文字幅に関するヒントを与える East_Asian_Width 参考特性(英: informative property)を定めている。 東アジアのマルチバイト文字コード規格は必ずしも文字幅を

    東アジアの文字幅 - Wikipedia
  • Windowsで:set encoding=utf-8する方法 - 永遠に未完成

    Vimの'encoding'オプションはVimが内部で扱うエンコーディングを設定する。この値がcp932やsjisなどだと、ユニコード文字が表示できない。今時ユニコード文字の表示なんてメモ帳でもできる。メモ帳に負けていいのか!否! と言うわけで是非とも:set encoding=utf-8で使いたいわけだが、Windowsでこれをやるとシステムメッセージなどが見事に文字化けする*1。で、これを回避する方法*2。 言語ファイルを入手する download : vim onlineから言語ファイル(ftp://ftp.vim.org/pub/vim/extra/vim-7.2-lang.tar.gz)をダウンロードしてくる。 中身からja.poを取り出し、UTF-8に変換する。 ja.sjis.poもあるが、これはダメ。中にダメ文字を回避するバックスラッシュが入ってる。 Vimでやる場合は、j

    Windowsで:set encoding=utf-8する方法 - 永遠に未完成
    aroma_black
    aroma_black 2010/08/12
    デフォルトのエンコーディングをUTF-8にする
  • モテたい一心でbrainf*ckをPythonに実行させる - None is None is None

    LLTigerで #encoding:ruby と書くだけで、Python上でRubyが動く、Ruby on Pythonが発表されました。 そして、よく分かりませんが、encodingのハックがゆくゆくはモテることにつながるらしいので、何か作ってみよう! でも、Rubyはかなり大変そう。一番簡単なのは・・・・・・brainf*ckだ! というわけで、 #bfcodec.py from __future__ import unicode_literals """ This code is under PSF License. Thanks Shibukawa Yoshiki! http://shibu.jp/ """ import encodings, codecs, sys, re import bf class aStreamReader(codecs.StreamReader): d

    モテたい一心でbrainf*ckをPythonに実行させる - None is None is None
    aroma_black
    aroma_black 2010/08/02
    encodingハック実装のbrainf*ck版
  • viで日本語の文字コードを自動判別 - 玉虫色に染まれ!!

    今日は以前の「Ubuntuのvimを快適にする」の続きとして、今日は文字コードの自動判別の設定を紹介します。 最近のディストリビューションでは、デフォルトのロケールが UTF-8 になっているので、CJKフォント(China, Japan, Korea……要はアジア系文字のフォント)さえ入っていれば、いちいちロケールを切り替えなくても、日語でも韓国語でも表示できてしまいます。なので、コマンドの出力などでは、特に意識しなくとも、文字化けすることは殆どありません。 vimも標準で文字コードの自動判別や変換に対応していますので、どのような文字コードで書かれたファイルでもきちんと読み書きできるのですが、自動判別を上手く効かせるためには、多少設定してやる必要があります。 .vimrc の設定 私が使っている自動判別の設定は以下の通りです。~/.vimrc ファイルの末尾に追加してみてください。 :

    viで日本語の文字コードを自動判別 - 玉虫色に染まれ!!
    aroma_black
    aroma_black 2009/11/30
    encodingとかfileencodingsとかの話
  • 1