[1] [DFN[[RUBYB[[[正準等価性]]]@en[canonical equivalence]]]]は、 [[基底文字]]と[[結合文字]]の列と[[合成済文字]]とを同一視するなどとした[[文字]]の[[等価性]]です。 [[正準等価性]]を保ちつつできるだけ[[基底文字]]と[[結合文字]]の列に[[分解]]することを[DFN[[RUBYB[[[正準分解]]]@en[canonical decomposition]]]]、 できるだけ[[合成済文字]]に[[結合]]することを[DFN[[RUBYB[[[正準結合]]]@en[canonical composition]]]]といいます。 * 仕様書 [REFS[ - [13] - [12] ]REFS] * 定義 > [14] [DFN[[RUBYB[[[正準分解]]]@en[canonical decomposition]]]]: [[Unicode Character Database]] と [CSECTION@en[[[Conjoining Jamo Behavior]]]] にある[[正準写像]]をそれ以上[[分解]]できる[[文字]]がなくなるまで再帰的に適用し、 [CSECTION@en[[[Normalization Forms]]]] に従い[[現在位置の前進を伴わない]]記号を並べ替えて得られる[[文字]]または[[文字]]の列の[[分解]]。 [SRC[>>13 D68]] * 歴史 ** 訂正 #3 [5] [[Unicode]] 3.0.0 から [[Unicode]] 3.1.1 までの間、[CODE(char)[[[U+F951]]]] [CODE(charname)@en[[[CJK COMPATIBILITY IDEOGRAPH-F951]]]] の[[正準分解]]が誤っていたとして、 [DFN[[RUBYB[訂正]@en[Corrigendum]] #3]] で修正されています。 [[Unicode]] 3.2.0 以降は正しくなっています。 [SRC[>>4]] [6] 旧版では [CODE(char)[[[U+96FB]]]] という全く関係ない[[漢字]]に[[正準分解]]されることになっていましたが、 新版では [CODE(char)[[[U+964B]]]] となっています。 [SRC[>>4]] [7] この[[漢字]]は余り使われていないし、[[弱い正規化安定性]]は満たされているので問題ないだろう [SRC[>>4]] とされていますが、全く違う[[文字]]に[[正規化]]されていて問題ないも何もないですねwww (この当時は[[強い正規化安定性]]は保証されていませんでした。) - [4] [CITE@en-us[Corrigendum #3: U+F951 Normalization]] ([TIME[2011-04-01 06:49:19 +09:00]] 版) ** 訂正 #4 [8] [[Unicode]] 3.2.0 において5つの[[CJK互換漢字]]の[[正準分解]]が誤っていたとして、 [DFN[[RUBYB[訂正]@en[Corrigendum]] #4]] で修正されています。 [[Unicode]] 4.0.0 以降は正しくなっています。 [SRC[>>9]] ,[[CJK互換漢字]],誤 ([[Unicode]] 3.2.0),正 ([[Unicode]] 4.0.0) ,[CODE(char)[[[U+2F868]]]],[CODE(char)[[[U+2136A]]]],[CODE(char)[[[U+36FC]]]] ,[CODE(char)[[[U+2F874]]]],[CODE(char)[[[U+5F33]]]],[CODE(char)[[[U+5F53]]]] ,[CODE(char)[[[U+2F91F]]]],[CODE(char)[[[U+43AB]]]],[CODE(char)[[[U+243AB]]]] ,[CODE(char)[[[U+2F95F]]]],[CODE(char)[[[U+7AAE]]]],[CODE(char)[[[U+7AEE]]]] ,[CODE(char)[[[U+2F9BF]]]],[CODE(char)[[[U+4D57]]]],[CODE(char)[[[U+45D7]]]] ;; [10] [CODE(char)[[[U+2F868]]]] は似た[[漢字]]との混同、それ以外は[[符号位置]]の入力ミスのようです。 - [9] [CITE@en-us[Corrigendum #4: Five Unihan Canonical Mapping Errors]] ([TIME[2011-04-01 06:49:26 +09:00]] 版) ;; [11] 今回は稀な文字だから問題ないなどという言い訳はありませんw * 関連 [2] [[正準等価性]]よりも同じとみなされる範囲が広い[[等価性]]、[[互換等価性]]もあります。 [3] [[正準分解]]は [[NFC]] と [[NFD]] で使われています。[[正準結合]]は [[NFC]] と [[NFKC]] で使われています。