used to replace an incoming character whose value is unknown or unrepresentable in Unicode compare the use of U+001A as a control character to indicate the substitute function
はじめに 文字列関係のWindows APIには、ANSI文字列版(関数名:????A)とUnicode文字列版(関数名:????W)があります。VBAからWindows APIを呼ぶ方法は、ネット上にもいくつか紹介されていますが、その多くがANSI文字列版についてのものです。 ここではUnicode文字列版の呼び出し方法について紹介したいと思います。 対象読者 VBA環境からWindows APIを利用されている方 VBAでUnicode対応のプログラムを作成されている方 なお、ANSI文字列版のWindows APIの呼び出し方法については、以下のMSDNなどを参照してください。 MSDN:「Office VBA と Windows API」 必要な環境 Windows VistaまたはWindows XP VBA開発環境(サンプルではExcelを使います) Unicode版が必要にな
みなさんはMySQLの文字化けに悩まされたことはありますか? MySQLではさまざまな文字コードと照合順序を扱うことができます。今回は、MySQLの文字コードの設定について見ていきたいと思います。 文字コードと設定 MySQLではデフォルトでlatin1という文字コードになっています。この文字コードは日本語を扱うことができないため、少し昔であればujisやsjis、いまでは多くの方が3バイトのutf8や、4バイト文字が扱えるutf8mb4に設定して利用されていると思います。 MySQLで設定できる文字コードは、SHOW CHARACTER SET構文で確認することができます。また、SHOW VARIABLES構文から現在設定されている文字コードを確認することができます。 > SHOW CHARACTER SET; +----------+--------------------------
ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか
先日、飲み会の席で、フォントに詳しい人と、フォントメーカーの人と一緒のテーブルになった。 で、なんでそんな話になったのかは忘れたんだけどそのテーブル、酒を飲みながら、UnicodeだのAdobe JapanだのIVSだのの単語が飛び交うという、ちょっとまぁ、それどうなの、酒飲みながらする話なのというようなテーブルになってしまって、一緒に飲んでいたその他大勢の皆様をどん引きさせてしまってたのですが、個人的にはそこでの話が大変面白かったので、忘れないうちに書いておこうと思う。 テーブルでは主にIVSについて、いまいちわかっていない素人(私)が「IVSって、私たちのDTP業務で使うフォントにどう関係してくるの?」っていうのを、詳しい人やら、フォントメーカーの人に解説してもらってたのだけど。 私「IVS(Ideographic Variation Sequence)って最近ちらほら耳にするんだけど
はじめに 本日2013年12月1日は、マンガ『ドラえもん』の原作者である藤子・F・不二雄の80歳の誕生日に当たるそうだ [1] 。 これを記念してというわけではないと思うのだが、11月26日に『2ちゃんねる』に「ドラえもんの特殊顔文字できたwwwwwwwwwww」というスレッド [2] が立った。そのスレッドには、文字だけを使って『ドラえもん』の主要キャラクターの顔が表現されていた。以下に、同スレッドで紹介されていた顔文字を再現したものを掲げる。 ドラえもんの特殊顔文字 こうした顔文字は、アクセント符号などのダイアクリティカルマークをつけることで作られている。どのようなしくみになっているのか以下で詳しく見ていこう。 特殊顔文字のしくみ 従来の顔文字は(-_-)や(^^)のように単純な記号で、単純な図像を表現するのみであった。しかし、近年様々な文字を組み合わせて、より表情豊かな顔文字が作られ
どんな人名も正しく表示? IPAの新フォントを試そう!:OSS界のちょっと気になる話(1)(1/2 ページ) 今日から始まるこの連載では、月に1回のペースで近ごろ注目を集めているOSS関連の話題の中から筆者が気になるものを紹介し、技術的背景を解説していこうと思う。連載初回となる今回は、2011年10月26日にIPA(独立行政法人情報処理推進機構)が提供を始めた「≪IPAmj明朝フォント≫」に焦点を当てたい。(編集部) 収録字数は6万字 「IPAmj明朝フォント」は、2011年10月26日にIPA(独立行政法人情報処理推進機構)が提供を始めたもので、人名に使う漢字を強化ポイントとして、約6万字の漢字を収録したものだ。同じくIPAが提供している「IPAex明朝フォント」のデザインを踏襲しつつ、次の漢字に対応している。 戸籍統一文字(5万5267字) 住民基本台帳ネットワーク統一文字(1万943
IVS検索 4.10 2021.7.28 更新 【バージョンアップについて】 ■「IVS検索 4.10」(2021/7/26) 1. 「検索」ボタン等の操作上の不具合を修正 2. 令和2年8月に「文字情報技術促進協議会」に信託譲渡されたことによるダウンロード元の修正 3. IPAmjPUPフォントのPUP領域の文字コード(暫定私用コード)の文字をコピーする機能を削除 ■「IVS検索 4.00」(2019/7/10) 1. 「MJ文字情報一覧表 Ver.006.01」に対応 2. 「IPAmj明朝フォントVer.006.01」に対応 [辞書検索]の手順 1.[部首]に「⾋ (くさかんむり)」を指定する。 2.[総画数]を「12」に指定する。 3.[辞書検索]ボタンをクリックする。 4.右下の[NumUpDown]の上向き矢印で「3」ページにする。 5.1行4列の「葛」を選択する。 6.左ペイ
IVSとは何か Unicodeでは、複数の異なる字形を一つに包摂して扱っています。 これによって、文字表がシンプルになる等のメリットがあったのですが、分野によっては包摂された文字を別個のものとして扱いたいという要望も存在しました。 その問題を解決するために、Unicodeが制定した仕組みがIVS(Ideographic Variation Sequence)になります(Unicodeテクニカルリポート37)。 簡単に言えば、IVSとは、プレーンなテキストデータとして異体字を使えるようにする仕組みです。 元々、IVSの仕組みは、モンゴル文字(ウイグル文字で書かれたモンゴル語)を表記するために制定されたものです。 モンゴル文字は、その使われる場(語頭・語中・語尾)によって字形が変化する文字です。その機能を実現し、なおかつ同じ文字が異なる文字として文字表に収録されるのを防ぐために、通常の文字+V
すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox とゲーム PC ゲーム Windows ゲーム 映画とテレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform Windows 365 開発者
先日、Twitterでどのように脆弱性を見つけるかに興味あるんだろうかと書いたら、意外に色々な人から反応があったので、これまでに自分が見つけた脆弱性のいくつかについてどういう経緯で見つけたのかちょっと書いてみます。 JVN#89344424: 複数のメールクライアントソフトにおける、添付ファイルによりメールクライアントソフトが使用不能になる脆弱性 これは、添付ファイル名にUnicodeの円記号を含めておくと、メーラ側でShift_JISに変換する際にバックスラッシュに変換されてしまって想定外のディレクトリに添付ファイルが展開されてしまったり、あるいは「©on」のような名前のファイルを添付しておくことでShift_JISに変換してCONというファイルを開こうとしてメーラが固まってしまうという問題です。これは、私自身が文字コードの問題について調べ始めた初期段階で、Unicodeからの変換で問題
小形克宏の「文字の海、ビットの舟」 ―― 文字コードが私たちに問いかけるもの [Reported by 小形克宏] 第1部 2000JISがやってきた 第1回 2000JISとはなんだ? (2000年1月19日) 第2回 2000JISの原案はなぜ修整されたか? (2000年1月26日)加筆修正 2000年2月22日 第3回 前回までの訂正と補遺 (2000年2月2日)加筆修正 2000年2月22日 第4回 JCS委員長、芝野耕司の反論(前編) (2000年2月9日)加筆修正 2000年2月12日 第5回 JCS委員長、芝野耕司の反論(後編) (2000年2月16日)加筆修正 2000年2月22日 特別編 MacOS Xの新フォントと2000JISの関係 (2000年2月23日) 特別編2 ISO/IEC 10646で却下された(?)JIS X 0213の新漢字一覧表 (2000年3月8日
コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基本単位として扱う前提で作られているものが中心です。そのなかで日本語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日本語の文字コードに関する基本を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く