#?SuikaWiki/0.9 page-icon="字β" [1] 【[[Unicode]]】 [[互換分解]]を持つ[[文字]]。 Compatible character。 - [[Unicode規格]]は、既存の基底規格での区別を表現するために互換文字を含めています。それらは [[legacy]] data の転送と処理を支援します。 Legacy data 用以外の使用は非推奨です。 - 互換文字のその分解との置換は基の規格との[[往復変換]]性を失うかもしれません。 ・・・と Unicode 3.0 3.6 D21 に書いてあります。 [2] 要は、 Unicode に入れてしまったけど他の文字の組合せで表現できる (と [[Unicoder]] の主張する) ごみのことです。 [3] 互換分解を持つ文字であって[[正規分解]]を持つ文字ではないので注意しましょう。 例えば、 Unicode の定義では [[CJK互換漢字]]は互換文字ではありません。 [4] 【[[UCS]]】 [[ISO/IEC 10646]] の定義はもっと曖昧です。 > :互換用文字 (compatibility character): 主として既存の[[符号化文字集合]]との互換のため、 この規格群に[[符号化文字]]として含めた[[図形文字]]。 ([[JIS X 0221]]‐1:2001 4.13, ISO/IEC 10646:2003 [[WD]] 4.13) 同22章「Compatibility Character」には互換文字がどの辺にあるのかは書かれていますが、具体的な文字の集合は規格のどこにも示されていません。 > - [[BMP]] では、互換文字の多くは[[区]] [CODE(char)[F9]], [CODE(char)[FA]], [CODE(char)[FE]], [CODE(char)[FF]], [CODE(char)[31]], [CODE(char)[33]] に割当てられている。 -- しかし他の位置にも割当てられている。 - [[SIP]] では、区 [CODE(char)[F8]]〜[CODE(char)[FA]] に割当てられている。 - [CODE(UCS)[CJK COMPATIBILITY IDEOGRAPHS-2001]] [WEAK[(ISO/IEC 10646‐2:2001 までに ISO/IEC 10646 に収録された CJK 互換漢字。詳しくは規格を見て欲しいが、 [CODE(UCS)[CJK COMPATIBILITY IDEOGRAPHS]] block の全ての文字が含まれるわけではない。)]] にある文字は本来 [[CJK統合漢字]]と統合すべきだった。 -- これらの文字は種々の理由で収録された。 -- そんなわけで互換漢字は既存規格との[[往復変換]]の時以外では非推奨。 なにげに、途中で CJK 互換漢字の話に摩り替えられています。 [10] > この規格群には互換用文字が含まれているが、これは、 既存の符号化文字集合との互換性を保ち、 情報を失うことなく双方向の符号変換を可能にすることを目的としている。 > BMP では、これらの文字の多くは、区 [CODE[F9]], [CODE[FA]], [CODE[FE]] 及び [CODE[FF]] 内並びに区 [CODE[31]] 及び [CODE[33]] 内の符号位置に割り当てている。 互換用文字の幾つかは、他の区の中にも割り当てている。 (JIS X 0221‐1:2001 22. 互換用文字) [5] なんにせよ、 Unicode と ISO/IEC で「互換文字」の定義は違っています。 ちなみに、 [[JIS]] にも「[[互換用文字]]」 とかいう同じような語があります。 [9] >>5 JIS X 0221 を見ると、 [Q[compatibility character]] の JIS での訳語が[Q[互換用文字]]らしいです。 [8] というわけで、説明なしで使うのには危険な語であります。 特に仕様書などでは、どの規格を参照してそう言っているのかはっきりさせるように気をつけましょう。 [WEAK[(と誰に注意しているのやら。)]] - [6] [[XML]] では互換文字の使用は非推奨ですが、ここで互換文字とは Unicode の互換文字 >>1 を指します。 - [7] >>6 の心は、[[全角英数字]]とか[[半角片仮名]]とかもう止めようぜ! ってところですか。