#?SuikaWiki/0.9 [1] > : (31) 回避文字 (番号) [shunned character (number)] : [[具象構文]]によってその構文を用いた[[文書]]の中では使用してはならないと識別された[[文字]] (番号)。 システムが誤って[[制御文字]]として扱う可能性がある文字を対象とする。 ([INS[[[JIS X 4151]]‐1992 3.]]) [2] 回避文字は、 [[SGML宣言]]内の具象構文中の回避文字番号指定によって指定します。 (JIS 12.4.2 参照。) -[7] [CODE(ABNF)[[DFN[回避文字番号指定]] := [[SHUNCHAR]] 1*[CODE(SGML)[[[ps]]]] ([[NONE]] / ([[CONTROLS]] / [[文字番号]]) *(1*[CODE(SGML)[ps]] 文字番号)) ;; (184)]] 仕様書: JIS X 4151‐1992 12.4.2 回避文字番号指定 [3] 回避文字番号指定に[[文字番号]]が指定してあれば、 その文字が回避文字となります。 [CODE(SGML)[[[CONTROLS]]]] が指定してあれば、 [Q[[[システム文字集合]]で[[制御文字]]となっている文字及び[[図形文字]]でない文字すべて]]が回避文字に含まれます。 [8] 鍵語 [CODE(SGML)[CONTROLS]] の意味は実装依存なので、 形骸化していて、一応は挙げてはおくものの、 制御文字の文字番号も全部一緒に並べておくことが慣例になっています。 [4] >>2-3 備考によれば、 回避文字の指定に現れた文字番号は[Q[文書を別の[[文字集合]]に変換する場合に変更する必要がない (したがって、変更しないことが望ましい。)]]のだそうです。 けど、文字集合変換して元の回避文字の文字番号が変換先で非回避文字の文字番号になってたらまずいと思いませんか? [5] 回避文字は[[非SGML文字]]となるのが基本ですが、 [[重要なSGML文字]]でもあるなら非 SGML 文字ではありません。 (JIS 12.1.2 を参照。) 2つの[[具象構文]]を使う時には、両方がこの規定の対象となります。 (JIS 12.1.2 備考 2. を参照。) [6] >>5,>>1 なんか変ですねぇ。 回避文字は使用してはいけない文字のはずなのに。 回避文字指定より重要文字指定の方が優先されるということでしょうが。 実際に[[規格参照具象構文]]では [[CL]] は回避文字になっていますが、 [CODE(SGML)[9]] 番などは[[機能文字]]なので、 非 SGML 文字にはならないそうです。 (JIS 12.1.2 備考 1. を参照。) [9] >>5 2つの〜というのは、いずれかの具象構文で重要文字なら、 その回避文字は非 SGML 文字ではない、 という意味にとるのが適当そうです。