パスワードを忘れた? アカウント作成
338032 journal

yasuokaの日記: 互換漢字とJTC1/SC2/WG2 N1698とIVS 3

日記 by yasuoka

PRI 184に対するカウンターアクションで私(安岡孝一)が書いた

住基統一文字FA20に対する新規IVSには、「U+8612 U+E0105」と「U+FA20 U+E0100」の両方を要求する。

に対し、互換漢字「蘒」(U+FA20)はIVSの基底文字になれない、とのコメントをいただいた。だったら、IVSの基底文字に互換漢字を許すようにするか、さもなくばU+FA20を互換漢字から統合漢字に格上げすればいいと思う。そもそも、互換漢字の中で特別扱いされてる12字にしたところで、JTC1/SC2/WG2 N1698 (March 2, 1998)の

Among these compatibility characters, CJK ideographs have been encoded to either represent duplicates of characters already encoded in the main CJK Unified Ideographs, or ideographs not yet encoded in that area, but used in industry practice.
The following character codes are part of that last category:
FA0E, FA0F, FA11, FA13, FA14, FA1F, FA21, FA23, FA24, FA27, FA28 and FA29.

の12字がそのままコピペされた、っていうだけのことだし。しかも元のN1698を読めばわかるとおり、この12字はあくまで一部分(part of)であって、それ以外にも特別扱いすべき互換漢字は、もちろん存在している。

ただ、私としては、そうやって特別扱いする互換漢字をチマチマ増やしていくよりは、IVSの基底文字に互換漢字を許してしまう方が、簡単だし楽だと思う。というのも、IVSにおいては、基底文字を一意に保つ必要が、もはや無くなってしまっているからだ。PRI 183をはじめとして、今後、複数の基底文字に同じグリフが割り当てられていく以上、IVSの基底文字に互換漢字を許さない、という考え方自体が、すでに意味の無いものだと言えるだろう。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
  • 今さらU+FA20を互換漢字から統合漢字に変更するのはstablility policy的に無茶な気がします。U+FA20と同じ字形を統合漢字として新たに追加提案するほうがまだ見込みがありそうです。Unicode 3.2以降に互換分解マッピングを訂正した前例もあるにはありますが、Unicode 6.1では訂正しないで互換漢字の追加で対処するみたいですし。
    > IVSの基底文字に互換漢字を許してしまう
    許されても分解マッピングが訂正されない限りU+FA20 U+E0100の正準分解はU+8612 U+E0100になってしまうので、ちっとも嬉しくないです。
    「互換漢字を基底文字にしても構わないが選択されうる字形は正準分解後のIVSと常に同じで、独立して登録することはできない」ならアリかも。U+8612 U+E0100とU+FA20 U+E0101とか書けるようになるので。

typodupeerror

にわかな奴ほど語りたがる -- あるハッカー

読み込み中...