#?SuikaWiki/0.9
[1] [[用字系]] (script) を同定するための[[札]] (tag) の命名規則 (案)。
*構文
[2] [[RFC3066]] の規定する[[言語札]]のように、複数の小札を
[CODE(CHARNAME)[HYPHEN-MINUS]] で結んだものを用字系札とする。
大文字・小文字の区別は一切しない。
-[4] script-tag = primary-subtag *("-" subtag)
-[6] primary-subtag = 1*8ALPHA
-[5] subtag = 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。
[3] 第1小札は [[ISO15924]] の4文字ラテン文字符号が規定されていればそれを使う。
1文字の第1小札は [CODE(ABNF)["s"]] と [CODE(ABNF)["x"]]
のみを使用し、前者は'''ここ'''で割当てた第2小札と組み合わせて使う。
後者は私用とし、公式な意味は割当てない。
この他の全ての第1小札は将来の拡張のために予約する。
[7] なお、 [CODE(SCRIPT)[Zzzz]] など特殊な意味を持つ ISO 16924
の用字系符号は原則として使用しない。
[8] 第1小札が ISO 16924 の規定する4文字ラテン文字符号の場合の第2小札及び第1小札が
[CODE(ABNF)["s"]] で第2小札が'''ここ'''で割当てる小札である場合の第3小札は、次の通りとする。
-[18] 1文字である場合は、 >>8 と同様とする。
-[9] 2文字である場合は、 [[ISO639]] の言語符号又は [[ISO3166]]
の国名符号の内のいずれかとする。
-[10] 3文字以上の場合は、文法的規則を除いて自由に決定出来る。
[11] >>3-8 の各項に該当しない小札は、文法的規則を除いて自由に決定出来る。
[[#comment]]
*意味
-[12] 用字系を識別する。例: [CODE(SCRIPT)[Latn]] ([[ラテン文字]])
-[13] 小札を使って[[正書法]]・転写法の類も含めることが出来る。
例: [CODE(SCRIPT)[Latn-ja-hebon]] (ヘボン式ローマ字)
-[14] 複数の用字系の組み合わせで一つの体系として機能するものも ISO 15924
に倣って一つの用字系とみなす。例: [CODE(SCRIPT)[Jpan]] (日本語文字 = 漢字 + 仮名)
[[#comment]]
*値
[15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。
[16] 但し、 ISO 15924 に規定する符号そのものの札は下記には掲載しない。
,用字系札 ,用字系名
,Brai-ja ,日本語用6点点字
,Hani-CN-simp ,簡体字
,Hani-kambun ,漢文
,Hani-trad ,伝統字 (繁体字)
,Jpan-JP-educate-[VAR[n]],日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字
,Jpan-JP-educate-[VAR[n]]-[VAR[YYYY]],日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ([VAR[YYYY]] 年に改訂された教育漢字の表)
,Jpan-JP-jouyou-gendai ,日本語文字/常用漢字表・現代仮名遣い
,Jpan-JP-touyou-gendai ,日本語文字/当用漢字表・現代仮名遣い
,Japn-kambun ,漢文 (書き下し文)
,Japn-old ,日本語文字/旧字旧仮名
,Japn-old-kana ,日本語文字/歴史的仮名遣
,Kana-ainu ,片仮名/アイヌ語
,Latn-ainu ,ラテン文字/アイヌ語
,Latn-ja ,ローマ字
,Latn-ja-hebon ,ヘボン式ローマ字
,Latn-ja-nihon ,日本式ローマ字
[[#form:'%text(lavel=>札,id=>tag); %text(label=>名,id=>langname); %text(id=>src,label=>典拠,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',%text(source=>tag); ,%text(source=>langname); ,%text(source=>src); ,%text(source=>comment);']]
*言語札との併用
[19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。
-[CODE(LANG)[ja-JP]]+[CODE(SCRIPT)[Hira]] (日本語(日本)/平仮名)
-[CODE(LANG)[ja-old]]; script=[CODE(SCRIPT)[Jpan-old]] (日本語古語/旧字旧仮名)
[20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14)
が、単なる用字系の混在の指定方法はプロトコルによる。例:
-日本語のかな漢字混じり文。
-[RUBY[English] [イングリッシュ]]
- [21] >>20 普通ある文字が同時に2つ以上の用字系に属すことはないから、マーク付け言語なら要素を細分化することで対応は出来ますがな。
[[#comment]]
*メモ
-[17] >>16 なんか無理があるなあ。
- [22] 内容折衝で Accept-Language: [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Japn-JP-educate-2]]"; q=1, [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Hira]]"; q=0.9, [CODE(LANG)[ja]]; q=0.8 とか出来たらいいよなぁ。
-[21] しかし ISO 15924 の WG の日本代表団 (いるんだよな?)
は [CODE(SCRIPT)[Kana]] = [CODE(SCRIPT)[Kata]] + [CODE(SCRIPT)[Hira]]
とかにすればよかったのに、
[CODE(SCRIPT)[Hrkt]] = [CODE(SCRIPT)[Kana]] + [CODE(SCRIPT)[Hira]]
にさせてしまうなんて、何考えてるんだ?
- [23] とりあえず、今の[[言語札]]の規格・実装で使うために、 [VAR[言語札]]-script-[VAR[用字系札]] とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。