> :結合文字 (combining character): [[符号化文字集合]]の識別された部分集合の構成単位であって、先行する非結合文字 (以下、[[基底文字]]という。) と組み合わせることを意図したもの、又は基底文字の後に結合文字の列が続いた形のものと組み合わせることを意図したもの。 ([[JIS X 0202]]:1998 4.8) [1] 2002-11-03 (日) 15:52 ''[[名無しさん]]'': ''非''結合文字は''被''結合文字の [[typo]] じゃないかと一瞬思いますが、[[規格]]を良く読むとこれで正しいことが分かります。 [2] > :結合文字 (combining character): この規格群で規定する符号化文字集合の識別された部分集合の構成単位であって、先行する非結合文字 (以下、基底文字という。) と組み合わせることを意図したもの、又は基底文字の後に結合文字の列が続いた形のものと組み合わせることを意図したもの (4.14 参照)。 ([[JIS X 0221]]‐1:2001 4.12) [3] 10646 での結合文字の使い方は、 24. に規定があります。結合文字の一覧は附属書 B にあります。結合文字が使えるかどうかは[[実装水準]]と関係します。 - 結合文字は、[[基底文字]]の後でなければなりません。 (24.1) - 結合文字自体を一つの[[結合列]]としたい時は、 [[間隔]]を基底文字とします。 (24.1) -- インド系用字系の [[matra]] (母音記号) は特殊で、周囲の複数の文字に依存するので、 間隔と結合させるのは望ましくありません。 (24.1 備考) - 一つの基底文字に結合できる結合文字の数は 10646 では規定しません。 (24.3) - 結合文字同士が表示に影響する場合 (例えば [CODE(char)[[[COMBINING MACRON]]]] と [CODE(char)[[[COMBINING DIAERESIS]]]]) は、だんだん外側に (MACRON より DIAERESIS を上に) 配置していきます。 - 縦方向ではなく横方向に並べたり、 隣接する結合文字と合字を作る結合文字もある。 横方向に進むときは、[[書字方向]]に従う。 - 結合文字同士が影響を与えない場合 (例えば上につくものと下につくもの) は、 逆の順序の場合と同じに見えてもよい。 [[#comment]] * ISO/IEC 2022 における図形文字の結合 [4] > '''6.3.3 図形文字の結合''' 特に指定されない限り、[[図形文字]]は、 [[結合文字]]としてはならない。すなわち、 隣接する[[図形文字]]と組み合わせようとしてはならない。 > [[図形文字集合]]によっては、複数の[[図形文字]]を一つの[[図形記号]]として[[可視化]]することによって、 追加の[[図形記号]] (例えば、[[アクセント付き文字]]) を[[図形表現]]することを許しているものもある。この[[規格]]では、 二つの結合方法があることを認識している。 > a) [[基底文字]]の[[図形文字]]は、[[制御文字]]の [CODE(charname)[[[BACKSPACE]]]] ([CODE(jcharname)[[[後退]]]]) 又は [CODE(charname)[[[CARRIAGE RETURN]]]] ([CODE(jcharname)[[[復帰]]]]) を使用して、組み合わせてよい。 > b) [[結合文字]]として[[指定]]されている[[図形文字]]は、 [[基底文字]]の[[図形文字]]と組み合わせてもよい。 > [[ISO 2375]] に従って、[[図形文字集合]]の登録を行おうとする申請者は、 [[集合]]中の[[結合文字]]を明らかにしておくことが期待される。 > 参考1. 登録では、これらの要件の詳細を求められないので、 [[文字集合]]を規定する[[規格]]は、[[結合文字]]がある場合、 それ自身で、これを指定しその用法を示しておくのがよい。 > 2. [[ISO/IEC 646]] の[[図形文字]]では、 [[アクセント付き文字]]を[[表現]]するのに、 a) の方法が認められている。 > 3. [[JIS X 0211]] では、第3の方法として、[[文字]]自身の仕様に関係なく、 [CODE(charname)[[[GRAPHIC CHARACTER COMBINATION]]]] ([CODE(charname)[[[GCC]]]]) の[[制御機能]]を使った[[図形文字]]の[[結合]]を規定している。 [SRC[[[JIS X 0202]]:1998]] [[#comment]] * メモ [5] [CITE@en[I'm not a Klingon ( ) : Most combining characters in a Unicode glyph/character/whatever]] ([TIME[2010-03-27 10:31:57 +09:00]] 版) [6] [CITE@en[Web Applications 1.0 r6611 Allow combining characters wherever, per Mark Davis.]] ( ([TIME[2011-10-02 16:17:00 +09:00]] 版)) [7] [CITE@en[Bug 13502 – Text run starting with composing character should be valid]] ( ([TIME[2013-11-25 16:50:57 +09:00]] 版))