by
Anonymous Coward
on 2022年12月07日 23時09分
(#4377022)
> Microsoft Print to PDFで出力したPDFからコピペすると 今回のケースも原因はそれだと思う。 Microsoft Print to PDFに限らず、FirefoxでメイリオやNotoなどCJKフォントを使ってPDFを出力すると発生する(Windows/Linux/macOS)。 印刷の仕組みを通すと、文字コード→グリフID→文字コードの変換が発生して番号の若い康煕部首に化ける、という説明はあるけど、Microsoftは対応してたりするので、それだけとも言えない。 つうか、他の原因は思いつかない。
IMEが出してくることがあるんで他意はない? (スコア:0)
メーラーが文字種警告してきたので気が付きましたけど。
CJK統合漢字か。混ぜるな危険。
# googleIME使うの止めようかな
Re:IMEが出してくることがあるんで他意はない? (スコア:1)
今回のケースとは関係無いだろうけど、Microsoft Print to PDFで出力したPDFからコピペすると、「日」なんかが康煕部首に変わってたりするね(参考 [scrapbox.io])。
Re:IMEが出してくることがあるんで他意はない? (スコア:2, 興味深い)
> Microsoft Print to PDFで出力したPDFからコピペすると
今回のケースも原因はそれだと思う。
Microsoft Print to PDFに限らず、FirefoxでメイリオやNotoなどCJKフォントを使ってPDFを出力すると発生する(Windows/Linux/macOS)。
印刷の仕組みを通すと、文字コード→グリフID→文字コードの変換が発生して番号の若い康煕部首に化ける、という説明はあるけど、Microsoftは対応してたりするので、それだけとも言えない。
つうか、他の原因は思いつかない。
Re: (スコア:0)
https://github.com/trueroad/tr-NTTtech05 [github.com]
によると最近の Chrome だと大丈夫になっているようです
> それでは化けてしまうグリフだけに /ActualText で CJK 統合漢字のコードポイントを付与する ことで文字化けしないようにしているようです。
という対策が追加されているらしいです
Re: (スコア:0)
割と最近までChromeもダメだったわけね。
康煕部首問題が割とあちこちにあるのはそのせいか。