『Character Code Structure and Extension Techniques』 (『文字符号の構造及び拡張法』) (旧『Code Extension Techniques』 (『情報交換用符号の拡張法』)) [[符号拡張法]]を規定する [[ISO/IEC]] の規格。 ISO/IEC [[JTC1/SC2/WG3]] が担当。 [[JIS]] 版は [[JIS X 0202]] (旧 [[JIS C 6228]])。 [[ECMA]] 版は [[ECMA 35]]。 [5] [[CNS]] 版は =[[CNS 7654]] (C 5123, X 5006) ‐1989 [CITE[資訊處理 ―― 七位元及八位元碼字元集 ―― 延碼技術]] 1989年 ([[中華民国]] 78 年) 7月15日制定。 =[[CNS 7654]] (X 5006) [CITE[資訊技術 ―― 字元碼結構及延伸技術]] ([CITE[Information technology ―― Character code structure and extension techniques]]) 1998年 ([[中華民国]] 86 年) 11月29日改訂。 [4] 最終改訂は1994年。改訂を経るごとに複雑になってきている。 元々完全実装を想定したものではなくて、環境によって 必要なだけ部分実装して使われるもので、実際に ISO/IEC 2022 の仕組みの一部を取り出した代表的な[[符号化方式]]に、 [[junet]] コード, [[EUC]] (拡張 Un*x 符号), [[X Window System]] の [[ctext]], [[ISO/IEC 8859]] 系列などがある。 *固定符号化文字 [2] ISO/IEC 2022 の世界では、常に特定のビット組合せに結び付けられている[[符号化文字]]が3つあります。 (ISO/IEC 2022:1994 6.2 参照。) ,略称,名前 ,符号表現 ,[[DEL]] ,[[DELETE]] ,07/15 ,[[ESC]] ,[[ESCAPE]] ,01/11 ,[[SP]] ,[[SPACE]] ,02/00 ただし、逆に、特定の文字が特定ビット組合せに結び付けられているのは、このうちの [CODE(char)[ESCAPE]] ⇔ [CODE(char)[01/11]] だけです。 ([CODE(char)[02/00]] と [CODE(char)[07/15]] は、 [[96集合]] や96[SUP[[VAR[n]]]] 集合が [[GL]] に呼出されている時には[[図形文字]] (の一部) になります。) [[#comment]] *文字集合 [3] ISO/IEC 2022 の世界で扱う (指示する) ことのできる符号化文字集合は、その大きさと割当てる図形文字の種類で 6種類に分けられます。 -[[制御文字集合]] --[[C0文字集合]] --[[C1文字集合]] -[[図形文字集合]] --[[94文字集合]] --[[96文字集合]] --[[94^n文字集合]] --[[96^n文字集合]] この他に ISO/IEC 2022 の世界で扱うことのできる符号化文字としては[[単独制御文字]]があります。 また、 [CODE(char)[[[DOCS]]]] を使うと ISO/IEC 2022 の外の世界の符号化文字を間接的に扱うことができます。 [[#comment]] *改訂によるおもな変更点 **(JIS C 6228-1984) -[1] 複数バイト図形文字集合が [[GR]] に呼び出せるようになる **ISO 2022-1986 -G4MDZ が ESC 02/04 F から ESC 02/04 02/08 F に変更 **ISO/IEC 2022:1994 (JIS X 0202:1998) -規格本文が全面的に書き直された。 (C.1) -[[符号識別機能]]に[[名前]]と略号が与えられた。 (C.2) -[[一意な符号化]]のための仕様が追加された。 (C.4) -[[単独シフト]]の後のビット組合せ (単独シフト領域のビット組合せ) が [[GL]] でも [[GR]] でもいいことが明記された。 (C.5) -[[ISO/IEC4873]] を基にした実装水準が規定された。 (C.6) -[[ASN.1]] 構文による表現が規定された。 (C.8) ([[JIS X 0202]]:1998 附属書C) [[#comment]] * メモ