#?SuikaWiki/0.9 page-icon="字β" [1] 【[[Unicode]]】 [[互換分解]]を持つ[[文字]]。 Compatible character。 - [[Unicode規格]]は、既存の基底規格での区別を表現するために互換文字を含めています。それらは [[legacy]] data の転送と処理を支援します。 Legacy data 用以外の使用は非推奨です。 - 互換文字のその分解との置換は基の規格との[[往復変換]]性を失うかもしれません。 ・・・と Unicode 3.0 3.6 D21 に書いてあります。 [2] 要は、 Unicode に入れてしまったけど他の文字の組合せで表現できる (と [[Unicoder]] の主張する) ごみのことです。 [3] 互換分解を持つ文字であって[[正規分解]]を持つ文字ではないので注意しましょう。 例えば、 Unicode の定義では [[CJK互換漢字]]は互換文字ではありません。 [4] 【[[UCS]]】 [[ISO/IEC10646]] の定義はもっと曖昧です。 > [INS[(ISO/IEC 10646:2003 [[WD]] 4.13)]] :互換文字 Compatibility Character:主に既存の[[符号化文字集合]]との互換のために ISO/IEC 10646 の[[符号化文字]]として含まれている[[図形文字]]。 同22章「Compatibility Character」には互換文字がどの辺にあるのかは書かれていますが、具体的な文字の集合は規格のどこにも示されていません。 - [[BMP]] では、互換文字の多くは[[区]] [CODE(char)[F9]], [CODE(char)[FA]], [CODE(char)[FE]], [CODE(char)[FF]], [CODE(char)[31]], [CODE(char)[33]] に割当てられている。 -- しかし他の位置にも割当てられている。 - [[SIP]] では、区 [CODE(char)[F8]]〜[CODE(char)[FA]] に割当てられている。 - [CODE(UCS)[CJK COMPATIBILITY IDEOGRAPHS-2001]] [WEAK[(ISO/IEC 10646‐2:2001 までに ISO/IEC 10646 に収録された CJK 互換漢字。詳しくは規格を見て欲しいが、 [CODE(UCS)[CJK COMPATIBILITY IDEOGRAPHS]] block の全ての文字が含まれるわけではない。)]] にある文字は本来 [[CJK統合漢字]]と統合すべきだった。 -- これらの文字は種々の理由で収録された。 -- そんなわけで互換漢字は既存規格との[[往復変換]]の時以外では非推奨。 なにげに、途中で CJK 互換漢字の話に摩り替えられています。 [5] なんにせよ、 Unicode と ISO/IEC で「互換文字」の定義は違っています。 ちなみに、 [[JIS]] にも「[[互換用文字]]」 とかいう同じような語があります。 というわけで、説明なしで使うのには危険な語であります。 特に仕様書などでは、どの規格を参照してそう言っているのかはっきりさせるように気をつけましょう。 [WEAK[(と誰に注意しているのやら。)]] - [6] [[XML]] では互換文字の使用は非推奨ですが、ここで互換文字とは Unicode の互換文字 >>1 を指します。 - [7] >>6 の心は、[[全角英数字]]とか[[半角片仮名]]とかもう止めようぜ! ってところですか。