CP932
CP932, Code Page 932, neboli Windows-31J je rozšíření kódování Shift-JIS vytvořené firmou Microsoft. Zahrnuje znakové sady JIS X 0201:1997, JIS X 0208:1997, speciální znaky NEC (řádek 13), NEC výběr rozšíření IBM (řádky 89-92) a rozšíření IBM (řádky 115-119). IANA používá pro toto kódování označení Windows-31J nebo csWindows31J, jeho MIB identifikátor je 2024.[1]
Tabulka kódování
editovatCP932 používá jedno- a dvoubytové kódy. Kódům 0-127 a 160-223 jsou přiřazeny znaky s jednobytovými kódy, ostatní hodnoty jsou prvním bytem dvoubytových kódů. Celé kódování definuje celkem 7980 znaků. Dvoubytový znak s kódem 0x82D7 (první byte: 0x82, druhý byte: 0xD7) v CP932 odpovídá znaku U+3079 v Unicode (hiragana písmeno BE, べ).
CP932 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Řídicí znaky | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | ŘZ |
8x | NZ | První byte dvoubytového kódu | ||||||||||||||
9x | ||||||||||||||||
Ax | NZ | 。 | 「 | 」 | 、 | ・ | ヲ | ァ | ィ | ゥ | ェ | ォ | ャ | ュ | ョ | ッ |
Bx | ー | ア | イ | ウ | エ | オ | カ | キ | ク | ケ | コ | サ | シ | ス | セ | ソ |
Cx | タ | チ | ツ | テ | ト | ナ | ニ | ヌ | ネ | ノ | ハ | ヒ | フ | ヘ | ホ | マ |
Dx | ミ | ム | メ | モ | ヤ | ユ | ヨ | ラ | リ | ル | レ | ロ | ワ | ン | ゙ | ゚ |
Ex | První byte dvoubytového kódu | |||||||||||||||
Fx | NZ | NZ | NZ | NZ |
„ŘZ“ označuje řídicí znak, „NZ“ označuje kód ve standardu nedefinovaný.
Znak s kódem 0x5C je sice mapován na kódový bod U+005C v Unicode, ale obvykle je zobrazován jako znak yen.[1]
Mapování na Unicode
editovatNásledující tabulka ukazuje mapování jednobytových kódů 0x80–0xFF z CP932 na Unicode. Kompletní mapování včetně dvoubytových kódů (jejichž úvodní byte je v tabulce označen „DBCSLB“ – anglicky Double Byte Character Set Lead Byte) je na serveru Unicode.[2]
CP932 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode |
0x80 | NZ | 0xA0 | NZ | 0xC0 | タ | U+FF80 | 0xE0 | DBCSLB | |||
0x81 | DBCSLB | 0xA1 | 。 | U+FF61 | 0xC1 | チ | U+FF81 | 0xE1 | DBCSLB | ||
0x82 | DBCSLB | 0xA2 | 「 | U+FF62 | 0xC2 | ツ | U+FF82 | 0xE2 | DBCSLB | ||
0x83 | DBCSLB | 0xA3 | 」 | U+FF63 | 0xC3 | テ | U+FF83 | 0xE3 | DBCSLB | ||
0x84 | DBCSLB | 0xA4 | 、 | U+FF64 | 0xC4 | ト | U+FF84 | 0xE4 | DBCSLB | ||
0x85 | DBCSLB | 0xA5 | ・ | U+FF65 | 0xC5 | ナ | U+FF85 | 0xE5 | DBCSLB | ||
0x86 | DBCSLB | 0xA6 | ヲ | U+FF66 | 0xC6 | ニ | U+FF86 | 0xE6 | DBCSLB | ||
0x87 | DBCSLB | 0xA7 | ァ | U+FF67 | 0xC7 | ヌ | U+FF87 | 0xE7 | DBCSLB | ||
0x88 | DBCSLB | 0xA8 | ィ | U+FF68 | 0xC8 | ネ | U+FF88 | 0xE8 | DBCSLB | ||
0x89 | DBCSLB | 0xA9 | ゥ | U+FF69 | 0xC9 | ノ | U+FF89 | 0xE9 | DBCSLB | ||
0x8A | DBCSLB | 0xAA | ェ | U+FF6A | 0xCA | ハ | U+FF8A | 0xEA | DBCSLB | ||
0x8B | DBCSLB | 0xAB | ォ | U+FF6B | 0xCB | ヒ | U+FF8B | 0xEB | DBCSLB | ||
0x8C | DBCSLB | 0xAC | ャ | U+FF6C | 0xCC | フ | U+FF8C | 0xEC | DBCSLB | ||
0x8D | DBCSLB | 0xAD | ュ | U+FF6D | 0xCD | ヘ | U+FF8D | 0xED | DBCSLB | ||
0x8E | DBCSLB | 0xAE | ョ | U+FF6E | 0xCE | ホ | U+FF8E | 0xEE | DBCSLB | ||
0x8F | DBCSLB | 0xAF | ッ | U+FF6F | 0xCF | マ | U+FF8F | 0xEF | DBCSLB | ||
0x90 | DBCSLB | 0xB0 | ー | U+FF70 | 0xD0 | ミ | U+FF90 | 0xF0 | DBCSLB | ||
0x91 | DBCSLB | 0xB1 | ア | U+FF71 | 0xD1 | ム | U+FF91 | 0xF1 | DBCSLB | ||
0x92 | DBCSLB | 0xB2 | イ | U+FF72 | 0xD2 | メ | U+FF92 | 0xF2 | DBCSLB | ||
0x93 | DBCSLB | 0xB3 | ウ | U+FF73 | 0xD3 | モ | U+FF93 | 0xF3 | DBCSLB | ||
0x94 | DBCSLB | 0xB4 | エ | U+FF74 | 0xD4 | ヤ | U+FF94 | 0xF4 | DBCSLB | ||
0x95 | DBCSLB | 0xB5 | オ | U+FF75 | 0xD5 | ユ | U+FF95 | 0xF5 | DBCSLB | ||
0x96 | DBCSLB | 0xB6 | カ | U+FF76 | 0xD6 | ヨ | U+FF96 | 0xF6 | DBCSLB | ||
0x97 | DBCSLB | 0xB7 | キ | U+FF77 | 0xD7 | ラ | U+FF97 | 0xF7 | DBCSLB | ||
0x98 | DBCSLB | 0xB8 | ク | U+FF78 | 0xD8 | リ | U+FF98 | 0xF8 | DBCSLB | ||
0x99 | DBCSLB | 0xB9 | ケ | U+FF79 | 0xD9 | ル | U+FF99 | 0xF9 | DBCSLB | ||
0x9A | DBCSLB | 0xBA | コ | U+FF7A | 0xDA | レ | U+FF9A | 0xFA | DBCSLB | ||
0x9B | DBCSLB | 0xBB | サ | U+FF7B | 0xDB | ロ | U+FF9B | 0xFB | DBCSLB | ||
0x9C | DBCSLB | 0xBC | シ | U+FF7C | 0xDC | ワ | U+FF9C | 0xFC | NZ | ||
0x9D | DBCSLB | 0xBD | ス | U+FF7D | 0xDD | ン | U+FF9D | 0xFD | NZ | ||
0x9E | DBCSLB | 0xBE | セ | U+FF7E | 0xDE | ゙ | U+FF9E | 0xFE | NZ | ||
0x9F | DBCSLB | 0xBF | ソ | U+FF7F | 0xDF | ゚ | U+FF9F | 0xFF | NZ |
Odkazy
editovatReference
editovatV tomto článku byl použit překlad textu z článku CP932 na polské Wikipedii.
- ↑ a b Microsoft Corporation. Update to windows-31J charset registration [online]. IANA [cit. 2017-04-26]. Dostupné online.
- ↑ Shawn Steele (Microsoft). cp932 to Unicode table [online]. [cit. 2017-04-26]. Dostupné online.
Související články
editovatExterní odkazy
editovat- Popis CODEPAGE 932 na FTP serveru Unicode Consorcia
- Mapování CP932 na Unicode
- IBM Japanese Graphic Character Set, Kanji Archivováno 2. 6. 2020 na Wayback Machine. – kódy z CP932 jsou uváděny ve sloupcích nadepsaných „PC Code“