絵文字がある種のUnicodeバグを世界から一掃しつつある件について｜Rui Ueyama

テクノロジーカテゴリーの変更を依頼記事元:

note.com/ruiu

1415 usersがブックマークコメント

コメント

282

記事へのコメント282件

注目コメント
新着コメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

絵文字がある種のUnicodeバグを世界から一掃しつつある件について｜Rui Ueyama

UnicodeのUTF-16エンコーディングではほとんどの文字（コードポイント）は2バイトで表現されるが、Unico... UnicodeのUTF-16エンコーディングではほとんどの文字（コードポイント）は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語

ブックマークしたユーザー

nezuku2024/06/16
ttsurumi2023/10/07
techtech05212023/09/16
zima03142022/01/05
ShionAmasato2021/06/22
kmaebashi2021/01/02
baboocon198204192020/11/15
honyacho2020/11/02
t2y-19792020/07/27
zeeko32020/07/27
messzylinder2020/05/10
inoueyuworks2020/05/04
tailtame2020/01/29
l080842019/11/18
killy19792019/11/17
uehaj2019/06/24
ihok2019/05/20
Pasta-K2019/05/07

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx