Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

CP932, Code Page 932, neboli Windows-31J je rozšíření kódování Shift-JIS vytvořené firmou Microsoft. Zahrnuje znakové sady JIS X 0201:1997, JIS X 0208:1997, speciální znaky NEC (řádek 13), NEC výběr rozšíření IBM (řádky 89-92) a rozšíření IBM (řádky 115-119). IANA používá pro toto kódování označení Windows-31J nebo csWindows31J, jeho MIB identifikátor je 2024.[1]

Tabulka kódování

editovat

CP932 používá jedno- a dvoubytové kódy. Kódům 0-127 a 160-223 jsou přiřazeny znaky s jednobytovými kódy, ostatní hodnoty jsou prvním bytem dvoubytových kódů. Celé kódování definuje celkem 7980 znaků. Dvoubytový znak s kódem 0x82D7 (první byte: 0x82, druhý byte: 0xD7) v CP932 odpovídá znaku U+3079 v Unicode (hiragana písmeno BE, べ).

CP932
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x Řídicí znaky
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ ŘZ
8x NZ První byte dvoubytového kódu
9x
Ax NZ
Bx ソ
Cx
Dx
Ex První byte dvoubytového kódu
Fx NZ NZ NZ NZ

ŘZ“ označuje řídicí znak, „NZ“ označuje kód ve standardu nedefinovaný.

Znak s kódem 0x5C je sice mapován na kódový bod U+005C v Unicode, ale obvykle je zobrazován jako znak yen.[1]

Mapování na Unicode

editovat

Následující tabulka ukazuje mapování jednobytových kódů 0x80–0xFF z CP932 na Unicode. Kompletní mapování včetně dvoubytových kódů (jejichž úvodní byte je v tabulce označen „DBCSLB“ – anglicky Double Byte Character Set Lead Byte) je na serveru Unicode.[2]

CP932
Hex Znak Unicode Hex Znak Unicode Hex Znak Unicode Hex Znak Unicode
0x80 NZ 0xA0 NZ 0xC0 U+FF80 0xE0 DBCSLB
0x81 DBCSLB 0xA1 U+FF61 0xC1 U+FF81 0xE1 DBCSLB
0x82 DBCSLB 0xA2 U+FF62 0xC2 U+FF82 0xE2 DBCSLB
0x83 DBCSLB 0xA3 U+FF63 0xC3 U+FF83 0xE3 DBCSLB
0x84 DBCSLB 0xA4 U+FF64 0xC4 U+FF84 0xE4 DBCSLB
0x85 DBCSLB 0xA5 U+FF65 0xC5 U+FF85 0xE5 DBCSLB
0x86 DBCSLB 0xA6 U+FF66 0xC6 U+FF86 0xE6 DBCSLB
0x87 DBCSLB 0xA7 U+FF67 0xC7 U+FF87 0xE7 DBCSLB
0x88 DBCSLB 0xA8 U+FF68 0xC8 U+FF88 0xE8 DBCSLB
0x89 DBCSLB 0xA9 U+FF69 0xC9 U+FF89 0xE9 DBCSLB
0x8A DBCSLB 0xAA U+FF6A 0xCA U+FF8A 0xEA DBCSLB
0x8B DBCSLB 0xAB U+FF6B 0xCB U+FF8B 0xEB DBCSLB
0x8C DBCSLB 0xAC U+FF6C 0xCC U+FF8C 0xEC DBCSLB
0x8D DBCSLB 0xAD U+FF6D 0xCD U+FF8D 0xED DBCSLB
0x8E DBCSLB 0xAE U+FF6E 0xCE U+FF8E 0xEE DBCSLB
0x8F DBCSLB 0xAF U+FF6F 0xCF U+FF8F 0xEF DBCSLB
0x90 DBCSLB 0xB0 U+FF70 0xD0 U+FF90 0xF0 DBCSLB
0x91 DBCSLB 0xB1 U+FF71 0xD1 U+FF91 0xF1 DBCSLB
0x92 DBCSLB 0xB2 U+FF72 0xD2 U+FF92 0xF2 DBCSLB
0x93 DBCSLB 0xB3 U+FF73 0xD3 U+FF93 0xF3 DBCSLB
0x94 DBCSLB 0xB4 U+FF74 0xD4 U+FF94 0xF4 DBCSLB
0x95 DBCSLB 0xB5 U+FF75 0xD5 U+FF95 0xF5 DBCSLB
0x96 DBCSLB 0xB6 U+FF76 0xD6 U+FF96 0xF6 DBCSLB
0x97 DBCSLB 0xB7 U+FF77 0xD7 U+FF97 0xF7 DBCSLB
0x98 DBCSLB 0xB8 U+FF78 0xD8 U+FF98 0xF8 DBCSLB
0x99 DBCSLB 0xB9 U+FF79 0xD9 U+FF99 0xF9 DBCSLB
0x9A DBCSLB 0xBA U+FF7A 0xDA U+FF9A 0xFA DBCSLB
0x9B DBCSLB 0xBB U+FF7B 0xDB U+FF9B 0xFB DBCSLB
0x9C DBCSLB 0xBC U+FF7C 0xDC U+FF9C 0xFC NZ
0x9D DBCSLB 0xBD U+FF7D 0xDD U+FF9D 0xFD NZ
0x9E DBCSLB 0xBE U+FF7E 0xDE U+FF9E 0xFE NZ
0x9F DBCSLB 0xBF ソ U+FF7F 0xDF U+FF9F 0xFF NZ

Reference

editovat

V tomto článku byl použit překlad textu z článku CP932 na polské Wikipedii.

  1. a b Microsoft Corporation. Update to windows-31J charset registration [online]. IANA [cit. 2017-04-26]. Dostupné online. 
  2. Shawn Steele (Microsoft). cp932 to Unicode table [online]. [cit. 2017-04-26]. Dostupné online. 

Související články

editovat

Externí odkazy

editovat