[1] [RUBYB[用字系][Script]]を同定するための札、 [DFN[[RUBYB[用字系札][script tag]]]]とかいうものです。 [[RFC 3036]] の[[言語札]]や [[ISO 3166]] の国名符号・ 地域符号のように、書字体系を識別します。ここで、 [Q[用字(系)]]あるいは[Q[書字体系]]とは、 広く[Q[[[文字]]・[[記号]]の使い方の体系]]と緩く定義します。 (その意味では [Q[script]] というより [Q[orthography]] に近いかもしれませんが、そうすると規範の存在を示唆するようなニュアンスがあります。) *構文 [2] [[RFC 3066]] の規定する[[言語札]]のように、複数の部分札を [CODE(char)[HYPHEN-MINUS]] で結んだものを用字系札とします。 大文字・小文字の区別は一切しません。 -[4] [CODE(ABNF)[[DFN[script-tag]] := primary-subtag *("-" subtag)]] -[6] [CODE(ABNF)[[DFN[primary-subtag]] := 1*8ALPHA]] -[5] [CODE(ABNF)[[DFN[subtag]] := 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。]] -[3] 第1部分札 ([CODE(ABNF)[primary-subtag]]) は、 次のように規定します。 -- 4文字であれば、原則として [[ISO 15924]] による4文字ラテン文字用字符号とします。 [WEAK[(用字系札の大文字・小文字は区別しませんが、特に理由がない場合、 ISO 15924 で定義された名前は最初の1文字のみ大文字で記述することを'''推奨'''します。)]] ---[30] 例外として、 [CODE(SCRIPT)[auto]], [CODE(SCRIPT)[none]] は [[XSL-FO]] と同じように定義します。 --- [CODE(SCRIPT)[[[Qaaa]]]]〜[CODE(SCRIPT)[[[Qabx]]]] (私用) は使用しません。 ---[7] [CODE(SCRIPT)[[[Zzzz]]]] (未符号化用字系) は原則として使用しては'''なりません'''。 -- [CODE(SCRIPT)[inherit]] は XSL-FO と同じように定義します。 -- 第1部分札 [CODE(SCRIPT)[s]] は、 ISO 15924 で割り当てられていない用字系のために使います。 -- 第1部分札 [CODE(SCRIPT)[x]] は、 私用のために使って'''構いません'''。公式な意味は割り当てません。 -- このほかすべての第1部分札は、将来の拡張のために予約します。 -[8] 第1部分札が ISO 16924 4文字符号の場合における第2部分札、 および第1部分札が [CODE(SCRIPT)[s]] である場合の第3部分札は、 次の通り規定します。 --[18] 第1部分札が4文字符号の場合で、第2部分札が1文字の場合、 >>3 と同じとします。 --[9] 2文字の部分札の場合、 [[ISO 639]] の2文字[[言語符号]]または [[ISO 3166]] の[[国名符号]]のいずれかとします。 [WEAK[(用字系札の大文字・小文字は区別しませんが、前者は小文字、後者は大文字とすることを推奨します。)]] --[31] 3文字以上の部分札の場合、 ISO 639 の3文字言語符号とすることを'''推奨'''します。 但し、 ISO 639 の2文字符号が定義されている場合、 3文字符号を使用しては'''なりません'''。 --[10]3文字以上の部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、 互換性のため、''ここ''に登録することを推奨します。 -[32] 第1部分札が [CODE(SCRIPT)[s]] の場合、 第2部分札は''ここ''で規定されているものとします。 - [11] 特に規定のない部分札は、文法的規則の範囲内で自由に使用して'''構いません'''が、 互換性のため、''ここ''に登録することを推奨します。 [[#comment]] *意味 -[12] 用字系を識別する。例: [CODE(SCRIPT)[Latn]] ([[ラテン文字]]) -[13] 小札を使って[[正書法]]・転写法の類も含めることが出来る。 例: [CODE(SCRIPT)[Latn-ja-hebon]] (ヘボン式ローマ字) -[14] 複数の用字系の組み合わせで一つの体系として機能するものも ISO 15924 に倣って一つの用字系とみなす。例: [CODE(SCRIPT)[Jpan]] (日本語文字 = 漢字 + 仮名) - [28] [WEAK[2003-10-24 17:29:30 +00:00]] ''[[矧]]'': しん - [29] [WEAK[2003-10-24 17:33:11 +00:00]] ''[[矧]]'': [[#comment]] *値 [15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。 [16] ,用字系札 ,ISO 15924 数値符号,用字名 (日本語),用字名 (英語),状態 ,[CODE(SCRIPT)[Arab]],[CODE[160]],,Arabic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Armn]],[CODE[230]],,Armenian,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[auto]]]],,自動 ,[CODE(SCRIPT)[Bali]],[CODE[360]],,Balinese,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Batk]],[CODE[365]],,Batak,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Beng]],[CODE[325]],,Bengali,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Blis]],[CODE[550]],,Blissymbols,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Bopo]],[CODE[285]],,Bopomofo,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Brah]],[CODE[300]],,Brahmi,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Brai]],[CODE[570]],,Braille,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[Brai-ja]]]],,日本語用6点点字 ,[CODE(SCRIPT)[Bugi]],[CODE[367]],,Buginese,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Buhd]],[CODE[372]],,Buhid,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Cans]],[CODE[440]],,Unified Canadian Aboriginal Syllabics,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Cham]],[CODE[358]],,Cham,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Cher]],[CODE[445]],,Cherokee,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Cirt]],[CODE[291]],,Cirth,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Copt]],[CODE[204]],,Coptic,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Cprt]],[CODE[403]],,Cypriot,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Cyrl]],[CODE[220]],,Cyrillic;2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Cyrs]],[CODE[221]],,Cyrillic (Old Church Slavonic variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Deva]],[CODE[315]],,Devanagari (Nagari),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Dsrt]],[CODE[250]],,Deseret (Mormon),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Egyd]],[CODE[070]],,Egyptian demotic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Egyh]],[CODE[060]],,Egyptian hieratic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Egyp]],[CODE[050]],,Egyptian hieroglyphs,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Ethi]],[CODE[430]],,Ethiopic (Ge‘ez),2004-10-25 ISO 登録 ,[CODE(SCRIPT)[Geor]],[CODE[240]],,Georgian (Mkhedruli),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Geok]],[CODE[241]],,Khutsuri (Asomtavruli and Khutsuri),2004-10-25 ISO 登録 ,[CODE(SCRIPT)[Glag]],[CODE[225]],,Glagolitic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Goth]],[CODE[206]],,Gothic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Grek]],[CODE[200]],,Greek,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Gujr]],[CODE[320]],,Gujarati,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Guru]],[CODE[310]],,Gurmukhi,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Hang]],[CODE[286]],,"Hangul (Hangŭl, Hangeul)",2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Hani]],[CODE[500]],,"Han (Hanzi, Kanji, Hanja)",2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[Hani-CN-simp]]]],,[[簡体字]] ([[中共]]) ,[CODE(SCRIPT)[[[Hani-kambun]]]],,[[漢文]] ,[CODE(SCRIPT)[[[Hani-kambun-JP]]]],,[[和様漢文]] ,[CODE(SCRIPT)[[[Hani-kangxi]]]],,[[康煕字典体]] ,[CODE(SCRIPT)[[[Hani-trad]]]],,[[伝統字]] ([[繁体字]]),Han (Simplified variant),時代遅れ ->[CODE(SCRIPT)[Hant]] ,[CODE(SCRIPT)[Hano]],[CODE[371]],,Hanunoo (Hanunóo),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Hans]],[CODE[501]],,Han (Simplified variant),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Hant]],[CODE[502]],,Han (Traditional variant),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Hebr]],[CODE[125]],,Hebrew,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Hira]],[CODE[410]],,Hiragana,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Hmng]],[CODE[450]],,Pahawh Hmong,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Hrkt]],[CODE[412]],,(alias for Hiragana + Katakana),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Hung]],[CODE[176]],,Old Hungarian,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Inds]],[CODE[610]],,Indus (Harappan),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[inherit]]]],,継承 ,[CODE(SCRIPT)[Ital]],[CODE[210]],,"Old Italic (Etruscan, Oscan, etc.)",2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ,[CODE(SCRIPT)[Jpan-JP-educate-[VAR[n]]-[VAR[YYYY]]]],,日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ([VAR[YYYY]] 年に改訂された教育漢字の表) ,[CODE(SCRIPT)[Jpan-JP-jouyou-gendai]],,日本語文字/常用漢字表 (1981年)・現代仮名遣い ,[CODE(SCRIPT)[Jpan-JP-touyou-gendai]],,日本語文字/当用漢字表・現代仮名遣い ,[CODE(SCRIPT)[Jpan-kambun]],,漢文 (書き下し文) ,[CODE(SCRIPT)[[[Jpan-kouki]]]],,[[いわゆる康煕字典体]] ,[CODE(SCRIPT)[Jpan-old]],,日本語文字/旧字旧仮名,,時代遅れ ->[CODE(SCRIPT)[Jpan-trad]] ,[CODE(SCRIPT)[Jpan-old-kana]],,日本語文字/歴史的仮名遣 ,[CODE(SCRIPT)[Jpan-trad]],,日本語文字/旧字旧仮名 ,[CODE(SCRIPT)[Java]],[CODE[361]],,Javanese,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Kali]],[CODE[357]],,Kayah Li,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Kana]],[CODE[411]],,Katakana,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[Kana-ainu]]]],,片仮名/アイヌ語 ,[CODE(SCRIPT)[Khar]],[CODE[305]],,Kharoshthi,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Khmr]],[CODE[355]],,Khmer,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Knda]],[CODE[345]],,Kannada,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Laoo]],[CODE[356]],,Lao,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Latf]],[CODE[217]],,Latin (Fraktur variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Latg]],[CODE[216]],,Latin (Gaelic variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Latn]],[CODE[215]],,Latin,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[[[Latn-ainu]],,ラテン文字/アイヌ語 ,[CODE(SCRIPT)[[[Latn-ja]],,羅馬字 ,[CODE(SCRIPT)[[[Latn-ja-hebon]],,ヘボン式羅馬字 ,[CODE(SCRIPT)[[[Latn-ja-nihon]],,日本式羅馬字 ,[CODE(SCRIPT)[Lepc]],[CODE[335]],,Lepcha (Róng),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Limb]],[CODE[336]],,Limbu,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Lina]],[CODE[400]],,Linear A,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Linb]],[CODE[401]],,Linear B,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Mand]],[CODE[140]],,Mandaean,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Maya]],[CODE[090]],,Mayan hieroglyphs,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Mero]],[CODE[100]],,Meroitic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Mlym]],[CODE[347]],,Malayalam,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Mong]],[CODE[145]],,Mongolian,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Mymr]],[CODE[350]],,Myanmar (Burmese),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Nkoo]],[CODE[165]],,N’Ko,2004-10-25 ISO 登録 ,[CODE(SCRIPT)[[[none]]]],,指定なし ,[CODE(SCRIPT)[Ogam]],[CODE[212]],,Ogham,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Orkh]],[CODE[175]],,Orkhon,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Orya]],[CODE[327]],,Oriya,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Osma]],[CODE[260]],,Osmanya,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Perm]],[CODE[227]],,Old Permic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Phag]],[CODE[331]],,Phags-pa,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Phnx]],[CODE[115]],,Phoenician,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Plrd]],[CODE[282]],,Pollard Phonetic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Qaaa]],[CODE[900]],,Reserved for private use (start),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Qabx]],[CODE[949]],,Reserved for private use (end),2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Roro]],[CODE[620]],,Rongorongo,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Runr]],[CODE[211]],,Runic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Sara]],[CODE[292]],,Sarati,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Shaw]],[CODE[281]],,Shavian (Shaw),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Sinh]],[CODE[348]],,Sinhala,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Sylo]],[CODE[316]],,Syloti Nagri,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Syrc]],[CODE[135]],,;Syriac,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Syre]],[CODE[138]],,Syriac (Estrangelo variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Syrj]],[CODE[137]],,Syriac (Western variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Syrn]],[CODE[136]],,Syriac (Eastern variant),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Tagb]],[CODE[373]],,Tagbanwa,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Tale]],[CODE[353]],,Tai Le,2004-10-25 ISO 登録 ,[CODE(SCRIPT)[Talu]],[CODE[354]],,New Tai Lue,2004-10-25 ISO 登録 ,[CODE(SCRIPT)[Taml]],[CODE[346]],,Tamil,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Telu]],[CODE[340]],,Telugu,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Teng]],[CODE[290]],,Tengwar,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Tfng]],[CODE[120]],,Tifinagh (Berber),2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Tglg]],[CODE[370]],,Tagalog,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Thaa]],[CODE[170]],,Thaana,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Thai]],[CODE[352]],,Thai,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Tibt]],[CODE[330]],,Tibetan,004-05-01 ISO 登録 ,[CODE(SCRIPT)[Ugar]],[CODE[040]],,Ugaritic,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Vaii]],[CODE[470]],,Vai,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Visp]],[CODE[280]],,Visible Speech,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Xpeo]],[CODE[030]],,Old Persian,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Xsux]],[CODE[020]],,Cuneiform,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Yiii]],[CODE[460]],,Yi,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Zxxx]],[CODE[997]],,Code for unwritten languages,2004-05-01 ISO 登録 ,[CODE(SCRIPT)[Zyyy]],[CODE[998]],,Code for undetermined script,2004-05-29 ISO 登録 ,[CODE(SCRIPT)[Zzzz]],[CODE[999]],,Code for uncoded script,2004-05-01 ISO 登録 [[#form:'%text(lavel=>札,id=>tag); %text(label=>名,id=>langname); %text(id=>src,label=>状態,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',[CODE(SCRIPT)[[[%text(source=>tag);]]]] ,%text(source=>langname); ,,%text(source=>src); ,%text(source=>comment);']] *言語札との併用 [19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。 -[CODE(LANG)[ja-JP]]+[CODE(SCRIPT)[Hira]] (日本語(日本)/平仮名) -[CODE(LANG)[ja-old]]; script=[CODE(SCRIPT)[Jpan-old]] (日本語古語/旧字旧仮名) [20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14) が、単なる用字系の混在の指定方法はプロトコルによる。例: -日本語のかな漢字混じり文。 -[RUBY[English] [イングリッシュ]] - [21] >>20 普通ある文字が同時に2つ以上の用字系に属すことはないから、マーク付け言語なら要素を細分化することで対応は出来ますがな。 - [24] >>19 [CODE(SCRIPT)[Jpan-classic]] 又は [CODE(SCRIPT)[Jpan-trad]] が良いと思われ [[#comment]] * 用字系札のようなものの各規格での採用例 [26] [[XSL-FO]] の [CODE(XSL)[[[script]]]] 特性では値に [CODE(ABNF)[ / 'auto' / 'none' / 'inherit']] を採用しています。 仕様書: [CSECTION[Formatting Properties]] [27] [CITE[Pronunciation Lexicon Specification (PLS) Version 1.0]] では [CODE(XMLa)[[[orthography]]]] 属性に [[ISO 15924]] の名前を採用しています。 同仕様 (や関連仕様) の [CODE(XMLa)[[[alphabet]]]] 属性では [CODE(XML)[[[ipa]]]] など表音字母の種類を指定しますが、 それもここでいう[Q[用字系札]]の範疇のような気もしますしむしろ[[言語札]]の特殊なもののような気もしますが自然言語は別レイヤで更に存在していますし(謎)。 結局言語と文字(の種類)と文字の使い方(の体系)は切っても切り離せないのに多対多対応なのが悪いのだ(謎)。 [[#comment]] *メモ -[17] >>16 なんか無理があるなあ。 - [22] 内容折衝で Accept-Language: [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Japn-JP-educate-2]]"; q=1, [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Hira]]"; q=0.9, [CODE(LANG)[ja]]; q=0.8 とか出来たらいいよなぁ。 -[21] しかし ISO 15924 の WG の日本代表団 (いるんだよな?) は [CODE(SCRIPT)[Kana]] = [CODE(SCRIPT)[Kata]] + [CODE(SCRIPT)[Hira]] とかにすればよかったのに、 [CODE(SCRIPT)[Hrkt]] = [CODE(SCRIPT)[Kana]] + [CODE(SCRIPT)[Hira]] にさせてしまうなんて、何考えてるんだ? - [23] とりあえず、今の[[言語札]]の規格・実装で使うために、 [CODE[[VAR[言語札]]-script-[VAR[用字系札]]]] とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。 - [25] 「[[康煕字典体]]」 [CODE(SCRIPT)[Hani-kangxi]], 「[[いわゆる康煕字典体]]」 [CODE(SCRIPT)[Hani-kouki]] なんてどうでしょう。後者の日本用字系版 [CODE(SCRIPT)[Jpan-kouki]] は明治時代の出版物の用字系とか。 - [27] >>22 でも独自拡張なので遠慮して [CODE[x-script]] にしておいたほうが。