#?SuikaWiki/0.9 ,%x00-7F ,ASCII (Type 1-1) ,%x80 .. ,Composite (Type N) ,%x81-8D C1 ,Dimension-1 Official (Type 1-2) ,%x8E .. ,free (ASCII) ,%x8F %xA0-BF ,Control-1 ,%x90-99 C21 C22 ,Dimension-2 Official (Type 2-3) ,%x9A-9D ,free ,%x9E %xA0-EF C1 ,Dimension-1 Private (Type 1-3) ,%x9F %xF0-FF C21 C22,Dimension-2 Private (Type 2-4) -[5] LC3 C31 C32 C33 Dimension-3 (Type 3-4) -[2] C1 = C -[3] C21 = C -[4] C22 = C -[6] Type-N = LCCMP 1*(LCN 1*C) -[8] LCCMP = %x80 -[9] LCN = %xA1-BF ;; LC + 0x20 -[7] C = %xA0-FF 最初のオクテット (または %x9E-9F の次のオクテット) は leading byte と呼びます。 leading byte: ,0x81,ISO/IEC 8859-1 ,0x82,ISO/IEC 8859-2 ,0x83,ISO/IEC 8859-3 ,0x84,ISO/IEC 8859-4 ,0x85,TIS 620-2533 ,0x86,ISO/IEC 8859-7 ,0x87,ISO/IEC 8859-6 ,0x88,ISO/IEC 8859-8 ,0x89,JIS X 0201-1976 Katakana ,0x8A,JIS X 0201-1976 Roman ,0x8B,ISO/IEC 8859-5 ,0x8C,ISO/IEC 8859-9 ,0x8D,unused ,0x8E,(ASCII) ,0x8F,Control-1 ([[C1文字集合]]) ,0x90,JIS X 0208-1978 ,0x91,GB 2312-80 ,0x92,JIS X 0208-1983 ,0x93,KS C 5601-1987 ,0x94,JIS X 0212-1990 ,0x95,CNS 11643 plane 1 ,0x96,CNS 11643 plane 2 ,0x97,Big5 Level 1 ,0x98,Big5 Level 2 ,0x99,unused ,0x9A,unused ,0x9B,unused ,0x9C,unused ,0x9E,1byte private ,0x9F,2byte private 内部表現にはまた別の19ビットのものを使います。 詳しくは src/mule-charset.h に説明があります。 - [1] 今から見ればちょっと設計の悪い符号ですね。設計後に何度か未使用の部分を修正しましたし。まあ仕方無いといえば仕方無い。