#?SuikaWiki/0.9 '''SGML Media Types [INS[SGML 媒体型]]''' -Network Working Group -Request for Comments: 1874 -Category: Experimental - E. Levinson - Accurate Information Systems, Inc. - December 1995 * Status of this Memo > This memo defines an Experimental Protocol for the Internet community. This memo does not specify an Internet standard of any kind. Discussion and suggestions for improvement are requested. Distribution of this memo is unlimited. *Abstract > This document proposes new media sub-types of Text/SGML and Application/SGML. These media types can be used in the exchange of SGML documents and their entities. Specific details for the exchange or encapsulation of groups of related SGML entities using MIME are currently being considered by the mimesgml Working Group . この文書は、新しい媒体亜型 [CODE(MIME)[Text/SGML]] および [CODE(MIME)[Application/SGML]] を提案します。これらの媒体型は SGML 文書および SGML 実体の交換に使うことができます。 関係する SGML 実体群を MIME を使って交換あるいはカプセル化するための詳細は現在 mimesgml 作業部会で検討中です。 *1. Introduction > A need exists for the transfer the elements of documents constructed using the Standard Generalized Markup Language (SGML) [ISO-8879]. While the specific details of such transfers are being considered general agreement exists on the need to register basic media types for the SGML entities not covered by existing types. 標準一般化マーク付け言語 ([[SGML]]) を使って構築された[[文書]]の要素を転送したいという需要があります。 その転送の詳細は検討中ですが、既存の型で覆われない SGML 実体のための基本媒体型を登録する必要性についての一般的合意が存在します。 > The Standard Generalized Markup Language (SGML) is used to encode document structure and a rigorous description of it is left to [ISO-8879]. The terms used in the present document attempt to be consistent with SGML terminology and usage. 標準一般化マーク付け言語 (SGML) は文書構造を符号化するために使用し、 その厳密な説明は [[ISO8879]] にあります。この文書で使用する用語は SGML 用語・用法と整合するようにしています。 *2. The SGML Media-Types > There are two media-types for SGML parsable entities, Text/SGML and Application/SGML. Both have the same optional parameters. Text/SGML provides a fallback to Text/Plain for those without SGML capability. Senders should base the choice between text and application media-types on the entity's content. Text is suggested for entities that would be meaningful to a human being without SGML processing. Application/SGML is recommended for all others. SGML [[解析実体]]の媒体型は [CODE(MIME)[[[text/sgml]]]] と [CODE(MIME)[[[application/sgml]]]] の2つあります。 両者は同じ省略可能引数を持ちます。 [CODE(MIME)[Text/SGML]] は、 SGML 能力のない [CODE(MIME)[[[text/plain]]]] への fallback を提供します。送信者は、実態の内容に基づき [CODE(MIME)[text]] 媒体型と [CODE(MIME)[application]] 媒体型から選ぶべきです。 SGML 処理をしなくても人間に意味があろう実体には [CODE(MIME)[text]] をすすめます。他のすべてのものには [CODE(MIME)[application/sgml]] を推奨します。 **2.1. Text/SGML > : MIME type name: Text : MIME subtype name: SGML : Required parameters: none : Optional parameters: charset, SGML-bctf, SGML-boot : Encoding considerations: may be encoded : Security considerations: see section 4 below : Published specification: ISO 8879:1986 : Person and email address to contact for further information: E. Levinson > The Text/SGML media-type can be employed when the contents of the SGML entity is intended to be read by a human and is in a readily comprehensible form. That is the content can be easily discerned by someone without SGML display software. Each record in the SGML entity, delimited by record start (RS) and record end (RE) codes, must correspond to a line in the Text/SGML body part. [CODE(MIME)[Text/SGML]] 媒体型は、 SGML [[実体]]の内容が人間によって読まれることを意図しており、読んで理解できる書式であると想定しているときに使うことができます。 つまり、内容は SGML 表示ソフトウェアがなくても容易に認識できます。 SGML 実体の各[[記録]]は[[記録開始]] ([CODE(SGML)[[[RS]]]]) 符号と[[記録終了]] ([CODE(SGML)[[[RE]]]]) 符号で区切りますが、 これは [CODE(MIME)[Text/SGML]] [[本体部分]]の[[行]]に対応しなければなりません。 > SGML entities that do not meet the above requirements should use the Application/SGML media-type. 上記の要件に合致しない SGML 実体は、 [CODE(MIME)[Application/SGML]] 媒体型を使うべきです。 > See section 2.3 for a description of the parameters. 引数の説明は2.3節を参照。 **2.2. Application/SGML > : MIME type name: Application : MIME subtype name: SGML : Required parameters: none : Optional parameters: SGML-bctf, SGML-boot : Encoding considerations: may be encoded : Security considerations: see section 4 below : Published specification: ISO-8879 : Person and email address to contact for further information: E. Levinson > Use the Application/SGML media-type for SGML text entities that are not appropriate for Text/SGML. When used, each record start (RS) and record end (RE) character shall be explicitly represented by the bit combination specified in the SGML declaration. [CODE(MIME)[Text/SGML]] が適切でない SGML [[文実体]]には [CODE(MIME)[Application/SGML]] 媒体型を使用。使用するときは、 各記録開始 ([CODE(SGML)[RS]]) 文字および記録終了文字 ([CODE(SGML)[RE]]) 文字は [[SGML宣言]]で指定された[[ビット組合せ]]を陽に表現しないといけません。 > The parameters are described in the next section. 引数は次の節で説明します。 **2.3. SGML Sub-type Parameters > The parameters for the Text/ and Application/SGML subtypes are defined below. [CODE(MIME)[Text/SGML]] 亜型および [CODE(MIME)[Application/SGML]] 亜型の引数は次の通り定義します。 > : charset :The charset parameter for Text/SGML is defined in [RFC-1521], the valid values and their meaning are registered by the Internet Assigned Numbers Authority (IANA) [RFC-1590]. The default charset value for all Text content-types is "us-ascii" [RFC-1521]. [CODE(MIME)[Text/SGML]] の [CODE(MIME)[[[charset]]]] 引数は [[RFC1521]] で定義されていて、妥当な値とその意味は [[IANA]] に登録されます。 すべての [CODE(MIME)[Text]] 内容型の既定 charset は [CODE(charset)[[[US-ASCII]]]] です。 > The charset parameter is provided to permit non-SGML capable systems to provide reasonable behavior when Text/SGML defaults to Text/Plain. SGML capable systems will use the SGML-bctf parameter. [CODE(MIME)[charset]] 引数は、 SGML 能力のないシステムで [CODE(MIME)[Text/SGML]] が既定の [CODE(MIME)[Text/Plain]] として適切に振舞うようにするために提供します。 SGML 能力のあるシステムは [CODE(MIME)[SGML-bctf]] 引数を使用します。 > : SGML-bctf :The SGML-bctf (SGML bit combination transformation format) parameter describes the method used to transform the entity's sequence of constant width binary numbers (called "bit combinations" in [ISO 8879, 4.24]) into the octet stream contained in the MIME body part. [CODE(MIME)[SGML-bctf]] (SGML ビット組合せ変形書式) 引数は、実体の一定幅二進数 ([[ISO8879]] で言うところの 「[[ビット組合せ]]」) の列を MIME 本体部分に含まれるオクテット列に変形するために使用した方式を記述します。 > Valid values for SGML-bctf are the BCTF notation names defined in Annex C of [ISO-10744] and are reproduced for convenience in the Appendix. The default value is "identity", i.e. perform no transformation. [CODE(MIME)[SGML-bctf]] で妥当な値は [[ISO10744]] の附属書 C で定義されている [[BCTF]] 記法名で、便宜上 [INS[(訳注) この文書の]]附属書に再録しています。 既定値は [CODE(SGML)[[[identity]]]] で、すなわち無変形です。 > : SGML-boot :The SGML-boot parameter value is the content-ID of a MIME body part (Application/Octet-stream) that satisfies the requirements of the boot attribute in [ISO-10744]. The Appendix contains a summary of those requirements. The SGML-boot parameter is only applicable if the SGML entity is a document entity. [CODE(MIME)[SGML-boot]] 引数値は、 [[ISO10744]] の [CODE(SGML)[[[boot]]]] 属性の要件を満足する MIME 本体部分 ([CODE(MIME)[[[application/octet-stream]]]]) の [CODE(MIME)[[[Content-ID]]]] です。 [INS[(訳注) この文書の]]附属書はこの要件の要約を含んでいます。 [CODE(MIME)[SGML-boot]] 引数は、 SGML 実体が[[文書実体]]であるときにのみ適用可能です。 *3. Security Considerations > SGML entities contain information to be parsed and processed by the recipient's SGML system. Those entities may contain and such systems may permit explicit system level commands to be execute while processing the data. To the extent that an SGML system will execute arbitrary command strings recipients of SGML entities may be at risk. SGML 実体は、受信者の SGML システムによって解析・処理される情報を含んでいます。 データの処理に際して陽なシステム水準命令を実行することを SGML 実体が含んでいるかもしれませんし、 SGML システムが認めているかもしれません。 SGML システムが任意の命令文字列を実行するのであれば SGML 実体の受信者は危険を背負うことになるかもしれません。 > Parsable SGML entities may also contain explicit processing instructions for a presentation or composition system; use of such instructions present concerns similar to those of Application/PostScript. 解析 SGML 実体は表現・組版システムに対する陽な[[処理指令]]をも含むかもしれません。 処理指令の使用は [CODE(MIME)[[[application/postscript]]]] と同様の不安をもたらします。 *4. References : [ISO-8879]: Information processing -- 8-bit Single-Byte Coded Graphic Character Sets -- Part 1: Latin Alphabet No. 1, ISO 8859-1:1987. : [ISO-8879]: ISO 8879:1986, Information processing -- Text and office systems -- Standard Generalized Markup Language (SGML). : [ISO-10744]: ISO/IEC 10744:1992, Information technology -- Hypermedia/Time-based Structuring Language (HyTime) (as modified by First Proposed Technical Corrigendum, ISO/IEC JTC1/SC18 N5027) : [RFC-1521]: Borenstein, N., and N. Freed, "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993. : [RFC-1590]: Postel, J., "Media Type Registration Procedure", RFC 1590, USC/Information Sciences Institute, March 1994. : [RFC-1642]: Goldsmith, D., and M. Davis, "UTF-7, A Mail-Safe Transformation Format of UNICODE", RFC 1642, Taligent, Inc., July 1994. *5. Author's Address > [PRE[ Ed Levinson Accurate Information Systems, Inc. 2 Industrial Way Eatontown, NJ 07724 EMail: ELevinson@Accurate.com ]PRE] *APPENDIX ISO-10744 BCTF Values and Boot Attribute **A.1. Bit Combination Transformation Format (BCTF) Values > The following list of Bit Combination Transformation Format (BCTF) values is provided as a convenience. The authoritative source is [ISO-10744]. 次のビット組合せ変形書式 ([[BCTF]]) の一覧は便宜のために提供します。 参照すべき原典は ISO 10744 です。 > : identity :Each bit combination is represented by a single octet; this BCTF can be used only for entities all of whose bit combinations have a value not exceeding 255. 各ビット組合せは単一の[[オクテット]]で表現します。 この BCTF は、すべてのビット組合せが 255 未満の値を持つときにのみ使用できます。 > : fixed-2 :Each bit combination is represented by exactly 2 octets, with the more significant octet first; this BCTF can be used only for entities all of whose bit combinations have a value not exceeding 65535. 各ビット組合せが丁度 2 オクテットで表現され、最重要オクテットがはじめに来ます。 この BCTF はすべてのビット組合せが 65535 未満の値を持つときにのみ使用できます。 > : fixed-3 :Each bit combination is represented by exactly 3 octets, with a more significant octet preceding any less significant octets; this BCTF can be used only for entities all of whose bit combinations have a value not exceeding 16777215. 各ビット組合せが丁度 3 オクテットで表現され、最重要オクテットがはじめに来、重みの小さなオクテットがそれに続きます。 この BCTF はすべてのビット組合せが 16777215 未満の値を持つときにのみ使用できます。 > : fixed-4 :Each bit combination is represented by exactly 4 octets, with a more significant octet preceding any less significant octets. 各ビット組合せが丁度 4 オクテットで表現され、最重要オクテットがはじめに来、重みの小さなオクテットがそれに続きます。 > : utf-8 :Each bit combination is represented by a variable number of octets according to UCS Transformation Format 8 defined in Annex P to be added by the first proposed drafted amendment (PDAM 1) to ISO/IEC 10646-1:1993. 各ビット組合せは、 [[ISO/IEC10646]]‐1:1993 の最初の提案修正原案 (PDAM 1) で追加された附属書 P で定義される UCS 変形書式 8 に従った可変数オクテットで表現します。 > : utf-7 :Each bit combination is represented by a variable number of octets in the range 0 through 127 as described in [RFC-1642]; this BCTF can be used only for entities all of whose bit combinations have a value not exceeding 65535. 各ビット組合せは [[RFC1642]] で説明されている通り範囲 0 〜 127 の可変数のオクテットで表現します。この BCTF はすべてのビット組合せが 65535 未満の値を持つときにのみ使用できます。 > : euc-jp :Each bit combination is treated as a pair of octets, most significant octet first, encoding a character using the Extended_UNIX_Code_Fixed_Width_for_Japanese charset, and is transformed into the variable length sequence of octets that would encode that character using the Extended_UNIX_Code_Packed_Format_for_Japanese charset. 各ビット組合せは、最重要オクテットが最初に来る、 [CODE(charset)[[[Extended_UNIX_Code_Fixed_Width_for_Japanese]]]] [[charset]] を使って文字を符号化して、 [CODE(charset)[[[Extended_UNIX_Code_Packed_Format_for_Japanese]]]] charset を使って文字を符号化したときの可変長のオクテット列に変形したオクテットの組として扱います。 > : sjis :Each bit combination is treated as a pair of octets, most significant octet first, encoding a character using the Extended_UNIX_Code_Fixed_Width_for_Japanese charset, and is transformed into the variable length sequence of octets that would encode that character using the Shift_JIS charset. 各ビット組合せは、最重要オクテットが最初に来る、 [CODE(charset)[Extended_UNIX_Code_Fixed_Width_for_Japanese]] charset を使って文字を符号化して、 [CODE(charset)[[[Shift_JIS]]]] charset を使って文字を符号化したときの可変長のオクテット列に変形したオクテットの組として扱います。 **A.2. The Boot Attribute >The body part specified by the SGML-boot parameter contains a sequence of triplets of positive integers separated by white space. The triplets correspond to the described character set portion [IS0-8879, 13.1.1.2] of the SGML declaration. SGML-boot provides the capability to identify the character set of the document's SGML declaration when it uses significant SGML characters [ibid., 4.298] in the SGML reference concrete syntax [ibid., 13.4] that have a character number [ibid., 4.44] in the document's character set that differs from us-ascii. The default value is "0 128 0", all characters are us-ascii. [CODE(MIME)[SGML-boot]] 引数で指定される本体部分は、 [[空白]]で分離した正整数の三つ組の列から成ります。 三つ組は、 SGML 宣言の文字集合部分の記述に対応します。 [CODE(MIME)[SGML-boot]] は、文書の SGML 宣言が、 us-ascii とは異なった[[文書文字集合]]中の[[文字番号]]を持つ SGML [[規格参照具象構文]]の[[重要なSGML文字]]を使うときに、その文字集合を識別する能力を提供します。 既定値は [CODE(SGML)[0 128 0]] で、すべての文字は us-ascii です。 > Notes: (1) The triplet, has the following meaning. Starting with character number dscn in the us-ascii character set, renumber noc characters starting at bscn and incrementing by one. Thus, 0 128 0, represents the identity mapping. (2) The document's declaration itself may also redefine the significant SGML characters; the boot attribute is intended to bootstrap the SGML system's parse of the declaration. 注意: - 三つ組 [SAMP(SGML)[[VAR[dscn]] [VAR[noc]] [VAR[bscn]]]] は次の意味を持ちます。 Us-ascii 文字集合中の文字番号 [VAR[dscn]] で始まり、 [VAR[bscn]] から始まって一ずつ増やして [VAR[noc]] 文字を再番号付けします。 従って、 [SAMP(SGML)[0 128 0]] は同一写像を表現します。 - 文書の宣言自身も重要な SGML 文字を再定義するかもしれません。 Boot 属性は SGML システムが宣言を解析するための bootstrap となることを想定しています。 * License [[RFCのライセンス]] * メモ