#?SuikaWiki/0.9 [1] さてはて、 なのですが、 XHTML 1 m12n SE の真似して (いまさらすぎ)、 XML Schema Instance (xsi) 名前空間を含めるようにしてみました。 (同じ引数実体を2回も定義してたりとか意味がわからないところは真似してないです。) 生成してみた DTD の例はこのあたりに: ([[名無しさん]] [WEAK[2004-06-20 05:23:37 +00:00]]) [2] だけど本当は Common Attributes Module のような形の別モジュールを用意しておいて、 必要なら DTD Driver で取り込む形にしたほうがよかったかもとか思ってみたり。 [CODE(XMLa)[[VAR[xsi:]][VAR[*]]]] ってそんなしばしば使うものでもないし。 ([[名無しさん]] [WEAK[2004-06-20 05:29:20 +00:00]]) [3] SGML HTML の support を打ち切れとか、のんきな人は気楽でいいねぇ。 ([[名無しさん]] [WEAK[2004-06-20 07:38:17 +00:00]]) [4] Perl の utf8 文字列 + 正規表現でよくわからない現象が起こったりする。原因も再現条件も (というか何が起こっているのかも) よくわからない。 正規表現の部分をうまくごまかして [CODE(perl)[[[substr]]]] にしてなんとか回避したけど、釈然としないものがあるなあ。 ([CODE(perl)[[[Devel::Peek]]]] でみたら、 [CODE(perl)[substr]] の前後で [CODE[MG_PTR]] が変わるみたいだけど、これ何よ?) 5.8.1-RC2 から 5.8.4 にしたけど変化なしだし。わけわからん。 ([[名無しさん]] [WEAK[2004-06-21 02:47:04 +00:00]]) [5] XML ではこんなのも整形式。 外部実体 1: [PRE(XML)[ ]PRE] 外部実体 [CODE(URI)[foo]]: [PRE(XML)[ element (%model;)* ]PRE] [[文宣言]]は[[置換文]]に含まれないから、 処理指令が引数に含まれるように見えるけど、何も問題は起こらない。 SGML 的にはこんなのなしだと思いますので、 改行正規化と同じで前処理と考えるしかないでしょうか。 ([[名無しさん]] [WEAK[2004-06-21 03:51:31 +00:00]]) [6] 仕様書をよく読んでみると、 >>5 の場合に文宣言を書いてはいけないとはかかれていないけど、書いてもいいとも書かれていない。 ,実体の種類 ,表記実体値が一致するべき生成規則 ,置換文が一致するべき生成規則 ,文書実体 ,[CODE(ABNF)[[[document]]]] ,外部部分集合 ,[CODE(ABNF)[[[extSubset]]]] ,[CODE(ABNF)[[[DeclSep]]]] 引数実体 , ,"[CODE(ABNF)[[[extSubsetDecl]]]], VC 適切な入れ子" ,マーク宣言引数の引数実体 , ,VC 適切な入れ子 ,群の引数実体 , ,VC 適切な入れ子 ,引数表記の引数実体 ,外部一般解析対象実体 ,[CODE(ABNF)[[[extParsedEnt]]]] ,内部一般解析対象実体 ,[CODE(ABNF)[[[EntityValue]]]] ,[CODE(ABNF)[[[content]]]] ([[名無しさん]] [WEAK[2004-06-21 04:24:33 +00:00]]) [7] >>5 文宣言があると、 MSXML も W3C Validator もエラーになります。 なければ妥当。 ([[名無しさん]] [WEAK[2004-06-21 05:25:20 +00:00]]) [8] ふと気づきましたが、誰も[Q[妥当制約]]とか[Q[整形式性制約]]とは言っていませんねぇ。 ;; 今のままのが字数もぴったりでいい。 ([[名無しさん]] [WEAK[2004-06-21 07:00:33 +00:00]]) [9] 整形式制約違反は致命的誤り。 ところが、[Q[整形式]]の定義からの逸脱はなんとも書かれていない。ということは、 EBNF 構文への違反は別途指定がない限り単なる誤りとして処理してよい? ([[名無しさん]] [WEAK[2004-06-21 07:21:57 +00:00]]) [10] >>4 ''search.cpan.org: perldelta - what is new for perl v5.8.3'' にそれっぽい修正が載ってるけど、 Perl 5.8.4 でも状況は変わらなかったんだよなぁ。へんだなぁ。 ([[名無しさん]] [WEAK[2004-06-21 23:13:47 +00:00]]) [11] utf8 まわりはほぼ毎版修正されているし、まだ虫がいると思ったほうがよさそう。 ([[名無しさん]] [WEAK[2004-06-21 23:16:33 +00:00]])