*Extended Unix Code (拡張 Unix 符号) [1] [DFN@en[EUC]] (拡張 UNIX 符号) は、 [[UNIX]] で [[ASCII]] と互換性を保ちつつ[[非ASCII文字]]を使うための枠組みとして考案された符号化方式です。 [2] '''符号化文字集合''': EUC [[符号化文字集合]]は次のように構成されます。 :[CODE(char)[0x00]]〜[CODE(char)[0x1F]]:[[C0]] :[CODE(char)[0x20]]:[CODE(charname)[[[SPACE]]]] :[CODE(char)[0x21]]〜[CODE(char)[0x7E]]:[[ISO/IEC 646]] [[新IRV]] [[図形文字集合]] :[CODE(char)[0x7F]]:[CODE(charname)[[[DELETE]]]] :[CODE(char)[0x80]]〜[CODE(char)[0x9F]]:[[C1]] ([CODE(char)[0x8E]] は [CODE(charname)[[[SS2]]]], [CODE(char)[0x8F]] は [CODE(charname)[[[SS3]]]]) :[CODE(ABNF)[1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]: [[G1]] ([[図形文字集合]]) :[CODE(ABNF)[[CODE(char)[0x8E]] 1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]: [[G2]] ([[図形文字集合]]) :[CODE(ABNF)[[CODE(char)[0x8F]] 1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]: [[G3]] ([[図形文字集合]]) ただし、 [[G1]], [[G2]], [[G3]] は任意の [[94]] または [[96]] の[[図形文字集合]]をそれぞれ高々1つずつ使用します。 図形文字集合は1バイトに限らず、2バイトでも3バイトでもそれ以上でも構いません。 (どんな[[図形文字集合]]の組合せを使うかによって、 具体的な[[符号化文字集合]]が確定します。) [3] EUC の符号の構造は、 [[ASCII]] と互換であること ([[ASCII]] と同じ[[オクテット]]は常に [[ASCII]] と同じ[[文字]]を表すこと) と [[ISO/IEC 2022]] と互換であること ([[EUC]] の[[オクテット列]]は [[ISO/IEC 2022]] の[[オクテット列]]でもあること) が大きな特徴となっています。この特徴から、 EUC の制定以前から使われていた [[UNIX]] の[[ソフトウェア]]を修正せずとも EUC が使えます。 [4] '''EUC の具体的な符号化文字集合''': ,通称,G1,G2,G3 ,古い[[日本語EUC]],[[JIS X 0208]]‐1983 (2バイト),[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト),[[外字]] (予約) ,[[EUC-JP]],[[JIS X 0208]]‐1990 (2バイト),[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト),[[JIS X 0212]]‐1990 (2バイト) ,[[eucJP-open]],[[JIS X 0208]]‐1990 (2バイト),[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト),[[JIS X 0212]]‐1990 および拡張文字 (2バイト) ,[[EUC-JISX0213]],[[JIS X 0213]]:2000 第1面 (2バイト),([[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト)),[[JIS X 0213]]:2000 第2面 (2バイト) ,[[EUC-JIS-2004]],[[JIS X 0213]]:2004 第1面 (2バイト),([[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト)),[[JIS X 0213]]:2004 第2面 (2バイト) ,[[EUC-CN]],[[GB 2312]]‐80 (2バイト),(使用しない),(使用しない) ,[[EUC-KR]],[[KS X 1001]] (2バイト),(使用しない),(使用しない) ,[[EUC-TW]],[[CNS 11643]]‐1992 第1面 (2バイト),[[CNS 11643]]‐1992 第2面 (2バイト),[[CNS 11643]]‐1992 の残りの面 (3バイト) ,[[ISO/IEC 8859]] 各部,[[ISO/IEC 8859]] 各部右半面 (1バイト),(使用しない),(使用しない) ,[[TIS 620]],[[TIS 620]] 右半面 (1バイト),(使用しない),(使用しない) [[#comment]] *End User Computing