#?SuikaWiki/0.9 [1] [[用字系]] (script) を同定するための[[札]] (tag) の命名規則 (案)。 *構文 [2] [[RFC3066]] の規定する[[言語札]]のように、複数の小札を [CODE(CHARNAME)[HYPHEN-MINUS]] で結んだものを用字系札とする。 大文字・小文字の区別は一切しない。 -[4] script-tag = primary-subtag *("-" subtag) -[6] primary-subtag = 1*8ALPHA -[5] subtag = 1*(ALPHA / DIGIT) ;; 8文字以下を推奨。 [3] 第1小札は [[ISO15924]] の4文字ラテン文字符号が規定されていればそれを使う。 1文字の第1小札は [CODE(ABNF)["s"]] と [CODE(ABNF)["x"]] のみを使用し、前者は'''ここ'''で割当てた第2小札と組み合わせて使う。 後者は私用とし、公式な意味は割当てない。 この他の全ての第1小札は将来の拡張のために予約する。 [7] なお、 [CODE(SCRIPT)[Zzzz]] など特殊な意味を持つ ISO 16924 の用字系符号は原則として使用しない。 [8] 第1小札が ISO 16924 の規定する4文字ラテン文字符号の場合の第2小札及び第1小札が [CODE(ABNF)["s"]] で第2小札が'''ここ'''で割当てる小札である場合の第3小札は、次の通りとする。 -[18] 1文字である場合は、 >>8 と同様とする。 -[9] 2文字である場合は、 [[ISO639]] の言語符号又は [[ISO3166]] の国名符号の内のいずれかとする。 -[10] 3文字以上の場合は、文法的規則を除いて自由に決定出来る。 [11] >>3-8 の各項に該当しない小札は、文法的規則を除いて自由に決定出来る。 [[#comment]] *意味 -[12] 用字系を識別する。例: [CODE(SCRIPT)[Latn]] ([[ラテン文字]]) -[13] 小札を使って[[正書法]]・転写法の類も含めることが出来る。 例: [CODE(SCRIPT)[Latn-ja-hebon]] (ヘボン式ローマ字) -[14] 複数の用字系の組み合わせで一つの体系として機能するものも ISO 15924 に倣って一つの用字系とみなす。例: [CODE(SCRIPT)[Jpan]] (日本語文字 = 漢字 + 仮名) [[#comment]] *値 [15] 使用する値は >>2- の規定に従っていれば登録する必要はないが、相互通信性の確保のためにここに登録することが望ましい。 [16] 但し、 ISO 15924 に規定する符号そのものの札は下記には掲載しない。 ,用字系札 ,用字系名 ,Brai-ja ,日本語用6点点字 ,Hani-CN-simp ,簡体字 ,Hani-kambun ,漢文 ,Hani-trad ,伝統字 (繁体字) ,Jpan-JP-educate-[VAR[n]],日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ,Jpan-JP-educate-[VAR[n]]-[VAR[YYYY]],日本語文字/[VAR[n]] (1〜6) 年生までに習う漢字 ([VAR[YYYY]] 年に改訂された教育漢字の表) ,Jpan-JP-jouyou-gendai ,日本語文字/常用漢字表・現代仮名遣い ,Jpan-JP-touyou-gendai ,日本語文字/当用漢字表・現代仮名遣い ,Japn-kambun ,漢文 (書き下し文) ,Japn-old ,日本語文字/旧字旧仮名 ,Japn-old-kana ,日本語文字/歴史的仮名遣 ,Kana-ainu ,片仮名/アイヌ語 ,Latn-ainu ,ラテン文字/アイヌ語 ,Latn-ja ,ローマ字 ,Latn-ja-hebon ,ヘボン式ローマ字 ,Latn-ja-nihon ,日本式ローマ字 [[#form:'%text(lavel=>札,id=>tag); %text(label=>名,id=>langname); %text(id=>src,label=>典拠,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',%text(source=>tag); ,%text(source=>langname); ,%text(source=>src); ,%text(source=>comment);']] *言語札との併用 [19] 言語札との併用方法は使用する規格に依存する。以下に例を示す。 -[CODE(LANG)[ja-JP]]+[CODE(SCRIPT)[Hira]] (日本語(日本)/平仮名) -[CODE(LANG)[ja-old]]; script=[CODE(SCRIPT)[Jpan-old]] (日本語古語/旧字旧仮名) [20] 1つの表記体系としての用字系の組み合わせは1つの用字系札とする (>>14) が、単なる用字系の混在の指定方法はプロトコルによる。例: -日本語のかな漢字混じり文。 -[RUBY[English] [イングリッシュ]] - [21] >>20 普通ある文字が同時に2つ以上の用字系に属すことはないから、マーク付け言語なら要素を細分化することで対応は出来ますがな。 [[#comment]] *メモ -[17] >>16 なんか無理があるなあ。 - [22] 内容折衝で Accept-Language: [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Japn-JP-educate-2]]"; q=1, [CODE(LANG)[ja]];script="[CODE(SCRIPT)[Hira]]"; q=0.9, [CODE(LANG)[ja]]; q=0.8 とか出来たらいいよなぁ。 -[21] しかし ISO 15924 の WG の日本代表団 (いるんだよな?) は [CODE(SCRIPT)[Kana]] = [CODE(SCRIPT)[Kata]] + [CODE(SCRIPT)[Hira]] とかにすればよかったのに、 [CODE(SCRIPT)[Hrkt]] = [CODE(SCRIPT)[Kana]] + [CODE(SCRIPT)[Hira]] にさせてしまうなんて、何考えてるんだ? - [23] とりあえず、今の[[言語札]]の規格・実装で使うために、 [VAR[言語札]]-script-[VAR[用字系札]] とつなげて使うのはどうですか? こうすれば、 (用字系札の小札が8文字以内である限りは) 合法的に利用できます。かなり冗長にはなりますが。