Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Tコードにおける部首変換 (#1182422) | 漢字の部首や画数などでも検索できる入力支援ツール | スラド
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

漢字の部首や画数などでも検索できる入力支援ツール」記事へのコメント

  • by mad-p (1491) on 2007年06月29日 17時14分 (#1182422)
    漢字直接入力方式のひとつ、Tコードでは'80年代から部首変換という名前で部首の組合せ機能が使われています(画数による検索はありません)。Tコードの場合は、直接入力における補助入力手段として位置づけられているため、部首定義の完全性よりは実用的な入力のしやすさ、決定性(ひとつの入力からは必ずひとつの出力が決まり、候補選択のような操作が発生しないことが望ましい)を重視しています。部首の指定に同じ形(に見える)カタカナを使ったりします。漢和辞典的な意味での部首とは限らないので部品と呼ぶことも多いです。
    http://www.sato.kuis.kyoto-u.ac.jp/~yuse/tcode/kw/doc/kanchoku.html#label-23 [kyoto-u.ac.jp]

    古い実装ではメモリ上の都合もあって、ひとつの漢字について2つの部品のみを定義し、その組合せをアルゴリズム的に計算して合成を行っていました(主に実装上のメモリ制約からこうなっていました)。その後、漢字に含まれる部品をもっと多く記述するアルゴリズムが開発され、現在のEmacs用実装tc.elでは後者が使われています。個人的な感覚では前者の方が好みですが、それは同じ字を日に何度も入力する使い方が多く、慣れるとterseでquickな方が楽になるからだと考えています。あるかないかわからない字をたまに入力するにはvariationが多くてverboseな方がよいでしょう。これは、日常的に入力する文字を指定するための手段(Tコードの部首変換や四角号碼)なのか、普段めったに使わない文字のための検索手段(超漢字検索)なのかによって、要求が違うということが反映されているのだと思います。

    漢字直接入力は人間の側の訓練を前提としたシステムであることが多く、検索システムとは別の思想、実装となっていて、その違いが結構面白いです。

    参考文献・リンク:
    ・ 小野芳彦, Tコードの補助入力: 字形組み合せ法と交ぜ書き変換法, 情報処理学会論文誌 Vol. 31 No. 3, pp.404-414 (1990)
    http://web.sfc.keio.ac.jp/~p92395kk/Input/t-code.html [keio.ac.jp]
    Wikipedia 部首変換 [wikipedia.org]

クラックを法規制強化で止められると思ってる奴は頭がおかしい -- あるアレゲ人

処理中...