#?SuikaWiki/0.9 [1] 言語札は [[RFC1766]] が定義していましたが、 [[RFC3066]] に改訂されました。 - [37] 非常に古い [[HTTP]] では、 RFC 1766 の [CODE(ABNF)["-"]] を使う方法ではなく [[POSIX]] の [[locale]] 名のように [CODE(ABNF)["_"]] で区切っていました。 ''Object Header lines in HTTP'' - [38] >>37 現在でも間違ってこちらが使われる可能性がありますから、実装は両方に対応しているといいかもしれません。 - [39] [[HTML]] 3.0 では [[lang]] 属性の値に [CODE(ABNF)["-"]] の代わりに [CODE(ABNF)["."]] を使っていました。 (''The Body Element and Related Elements'' ) [[#comment]] *言語札の値 [2] 言語札の値で、 [[ISO639]] そのものでないものを集めます。 ,名前 ,言語 ,(札の)典拠 ,参考 ,ar-AE ,Arabic/UAE ,[MOZILLA] , ,ar-BH ,Arabic/Bahrain ,[MOZILLA] , ,ar-DZ ,Arabic/Algeria ,[MOZILLA] , ,ar-EG ,Arabic/Egypt ,[MOZILLA] , ,ar-IQ ,Arabic/Iraq ,[MOZILLA] , ,ar-JO ,Arabic/Jordan ,[MOZILLA] , ,ar-KW ,Arabic/Kuwait ,[MOZILLA] , ,ar-LB ,Arabic/Lebanon ,[MOZILLA] , ,ar-LY ,Arabic/Libya ,[MOZILLA] , ,ar-MA ,Arabic/Morocco ,[MOZILLA] , ,ar-OM ,Arabic/Oman ,[MOZILLA] , ,ar-QA ,Arabic/Qatar ,[MOZILLA] , ,ar-SA ,Arabic/Saudi Arabia ,[MOZILLA] , ,ar-SY ,Arabic/Syria ,[MOZILLA] , ,ar-TN ,Arabic/Tunisia ,[MOZILLA] , ,ar-YE ,Arabic/Yemen ,[MOZILLA] , ,az-arabic ,アゼルバイジャン語(アラビア文字) ,[RFC 1766] ,az-cyrillic ,アゼルバイジャン語(キリル文字) ,[RFC 1766] ,art-lojban , ,[IANAREG] , ,cel-gaulish , ,[IANAREG] , ,de-1901 , ,[IANAREG] , ,de-1996 , ,[IANAREG] , ,de-AT ,独語/Austria ,[MOZILLA] , ,de-AT-1901 , ,[IANAREG] , ,de-AT-1996 , ,[IANAREG] , ,de-CH ,独語/Switzerland ,[MOZILLA] , ,de-CH-1901 , ,[IANAREG] , ,de-CH-1996 , ,[IANAREG] , ,de-DE ,独語/Germany ,[MOZILLA] , ,de-DE-1901 , ,[IANAREG] , ,de-DE-1996 , ,[IANAREG] , ,de-LI ,独語/Liechtenstein ,[MOZILLA] , ,de-LU ,独語/Luxembourg ,[MOZILLA] , ,en-AU ,オーストラリア英語 ,[MOZILLA] , ,en-BZ ,英語/Belize ,[MOZILLA] , ,en-CA ,英語/Canada ,[MOZILLA] , ,en-cockney ,ロンドン英語 ,[RFC 1766] , ,en-GB ,英語/Great Britain ,[MOZILLA] , ,en-IE ,英語/Ireland ,[MOZILLA] , ,en-JM ,英語/Jamaica ,[MOZILLA] , ,en-JP ,[[ジャパニッシュ]] ,en-NZ ,英語/New Zealand ,[MOZILLA] , ,en-PH ,英語/フィリピン ,[MOZILLA] , ,en-scouse ,英語 Liverpool 方言 ,[IANAREG] , ,en-TT ,英語/Trinidad ,[MOZILLA] , ,en-US ,[[米語]] ,[RFC 3066] ,en-US-slang ,米俗語 ,[QUIALANG] (>>21) ,en-ZA ,英語/南アフリカ ,[MOZILLA] , ,en-ZW ,英語/Zimbabwe ,[MOZILLA] , ,es-AR ,[RUBY[西班牙] [スペイン]]語/Argentina ,[MOZILLA] , ,es-BO ,西班牙語/Bolivia ,[MOZILLA] , ,es-CL ,西班牙語/Chile ,[MOZILLA] , ,es-CO ,西班牙語/Colombia ,[MOZILLA] , ,es-CR ,西班牙語/Costa Rica ,[MOZILLA] , ,es-DO ,西班牙語/ドミニカ共和国 ,[MOZILLA] , ,es-EC ,西班牙語/Ecuador ,[MOZILLA] , ,es-ES ,西班牙語/Spain ,[MOZILLA] , ,es-GT ,西班牙語/Guatemala ,[MOZILLA] , ,es-HN ,西班牙語/Honduras ,[MOZILLA] , ,es-MX ,西班牙語/Mexico ,[MOZILLA] , ,es-NI ,西班牙語/Nicaragua ,[MOZILLA] , ,es-PA ,西班牙語/Panama ,[MOZILLA] , ,es-PY ,西班牙語/Parguay ,[MOZILLA] , ,es-PE ,西班牙語/Peru ,[MOZILLA] , ,es-PR ,西班牙語/Puerto Rico ,[MOZILLA] , ,es-SV ,西班牙語/El Salvador ,[MOZILLA] , ,es-US ,西班牙語/合衆国 ,[MSIE] , ,es-UY ,西班牙語/Uruguay ,[MOZILLA] , ,es-VE ,西班牙語/Venezuela ,[MOZILLA] , ,fr-BE ,仏語/Belgium ,[MOZILLA] , ,fr-CA ,仏語/Canada ,[MOZILLA] , ,fr-CH ,仏語/スイス ,[MOZILLA] , ,fr-FR ,仏語/仏蘭西 ,[MOZILLA] , ,fr-LU ,仏語/ルクセンブルク ,[MOZILLA] , ,fr-MC ,仏語/モナコ ,[MOZILLA] , ,i-ami , ,[IANAREG] , ,i-bnn , ,[IANAREG] , ,i-cherokee , ,[RFC 1766] , ,i-enochian , ,[IANAREG] , ,i-default ,''既定言語'' ,[[RFC2277]>>10647] [IANAREG] ,i-hak ,客家語 ,[IANAREG] ,非推奨 ([CODE(LANG)[zh-hakka]]) ,i-klingon , ,[IANAREG] , ,i-lux , ,[IANAREG] ,非推奨 ([CODE(LANG)[lb]]) ,i-mingo , ,[IANAREG] , ,i-navajo , ,[IANAREG] ,非推奨 ([CODE(LANG)[nv]]) ,i-pwn , ,[IANAREG] , ,i-sami-no ,北セミ語 ,[RFC 1766] , ,i-tao , ,[IANAREG] , ,i-tay , ,[IANAREG] , ,i-tsolyani, ,[[RFC3066]>>20] ,i-tsu , ,[IANAREG] , ,it-CH ,伊語/Switzerland ,[MOZILLA] , ,ja-2ch ,日本語/にちゃんねる語 ,ja-JP ,日本語/日本 , ,[[RFC2482]] ,ja-ckassic ,日本語/古語 ,ja-classic-heian ,日本語/古語/平安時代 ,ja-ryuukyuu ,琉球語 ,ko-KP ,朝鮮語/北朝鮮 ,[MOZILLA] , ,ko-KR ,韓語/韓国 ,[MOZILLA] , ,mk-MK ,マケドニア語/マケドニア ,[MOZILLA] , ,nl-BE ,オランダ語/ベルギー ,[MOZILLA] , ,nb-no ,諾威語/ブークモール ,[MSIE] , ,nn-no ,新諾威語/諾威 ,[MSIE] , ,no-bok , ,[IANAREG] ,非推奨 ([CODE(LANG)[nb]]) ,no-nyn ,新[RUBY[諾威] [ノルウェイ]]語 ,[IANAREG] ,非推奨 ([CODE(LANG)[nn]]) ,no-nynorsk ,新諾威語 ,[RFC 1766] ,非推奨 ([CODE(LANG)[nn]]) ,pt-BR ,ポルトガル語/ブラジル ,[MOZILLA] , ,ro-MD ,ルーマニア語/モルドバ ,[MSIE] , ,ro-MO ,ルーマニア語/モルドバ , ,ru-MD ,露西亜語/モルドバ ,[MSIE] , ,ru-MO ,露西亜語/モルドバ , ,sgn-BE-fr , ,[IANAREG] , ,sgn-BE-nl , ,[IANAREG] , ,sgn-BR , ,[IANAREG] , ,sgn-CH-de , ,[IANAREG] , ,sgn-CO , ,[IANAREG] , ,sgn-DE , ,[IANAREG] , ,sgn-DK , ,[IANAREG] , ,sgn-ES , ,[IANAREG] , ,sgn-FR , ,[IANAREG] , ,sgn-GB , ,[IANAREG] , ,sgn-GR , ,[IANAREG] , ,sgn-IE , ,[IANAREG] , ,sgn-IT , ,[IANAREG] , ,sgn-JP , ,[IANAREG] , ,sgn-MX , ,[IANAREG] , ,sgn-NL , ,[IANAREG] , ,sgn-NO , ,[IANAREG] , ,sgn-PT , ,[IANAREG] , ,sgn-SE , ,[IANAREG] , ,sgn-US , ,[IANAREG] , ,sgn-US-MA,マーサズ[RUBY[葡萄園] [ヴィンヤード]]島の手話,[[RFC3066]>>19] ,sgn-ZA , ,[IANAREG] , ,sv-FI ,瑞典語/[RUBY[芬蘭] [フィンランド]] ,[MOZILLA] , ,x-ainu ,[[アイヌ語]] ,x-pig-latin , ,[[RFC2616]] , ,x-klingon ,クリンゴン語 ,[RFC 1766] ,非推奨 ([CODE(LANG)[i-klingon]]) ,zh-CN ,中文/中華大陸 ,[MOZILLA] , ,zh-gan , ,[IANAREG] , ,zh-guoyu , ,[IANAREG] , ,zh-hakka ,[[客家語]] ,[IANAREG] , ,zh-HK ,中文/[[香港]] ,[MOZILLA] , ,zh-mandarin ,[[中文]][[官話方言]] ,[639FAQ] (>>3) ,zh-min , ,[IANAREG] , ,zh-min-nan , ,[IANAREG] , ,zh-MO ,中文/[RUBY[澳門] [マカオ]] ,[MSIE] , ,zh-SG ,中文/[RUBY[新加坡] [シンガポール]] ,[MOZILLA] , ,zh-TW ,中文/台湾 ,[MOZILLA] , ,zh-wuu , ,[IANAREG] , ,zh-xiang , ,[IANAREG] , ,zh-yue , ,[IANAREG] , [[#form:'%text(lavel=>札,id=>tag); %text(label=>言語名,id=>langname); %text(id=>src,label=>典拠,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',%text(source=>tag); ,%text(source=>langname); ,%text(source=>src); ,%text(source=>comment);']] [22] RFC 3066 によれば、第2小札以降は文法規則 (特に、字数制限: 3〜8文字に注意) に従う限り自由に使っていいことになっています。このため言語札の一意性は保障されないでしょう。 もっとも言語はそう簡単に増えたり減ったりするものではないですから、滅多なことでは衝突しないでしょうが・・・。 - [44] しかし衝突はしなくても、同じ言語/方言を表す名前が複数存在してしまうことになりかねません。 - [45] 言語札のレベルでは解決できない問題として、言語/方言の区分の方法による非一意性もあります。 >>25 の大阪弁/関西弁問題や、台湾の外省人の言語が北京語と同じなのか (違うかな。) とか。 - [46] >>45 でも中国で北京語といったら北京方言のことで、官話方言のことじゃないそうですね。日本語共通語と山手方言とか江戸っ子言葉の関係みたいなもん? [[#comment]] *用字系の識別 [19] RFC 1766 は[[用字系]]の識別までを含めた例として [CODE(LANG)[az-arabic]] と [CODE(LANG)[az-cyrillic]] を挙げていますが、 RFC 3066 にはそのような用途の例示さえありません。 [639FAQ] (>>3) は用字系の識別には言語符号より [[ISO15924]] を使うようにと言っているのと関係があるかもしれません (しないかもしれません)。 [20] しかしなんにせよ用字系の指定も含めた言語札が使えた方が、 (用字系を別途指定出来る規格なんて多分ないので) 良いと思います。 - [30] [[正書法]]がどうこうを含んだ奴は用字系込みに近いよな。違うことは違うが。 - [35] >>19-30 [[用字系札]]を使えるようにしる! [[#comment]] *ja-* について [23] 日本語の方言にも星の数ほど種類がありますから、全部 ja-[VAR[foo]] にすると大変なことになります。 一つの提案として、[[日本国]]内の地域を主要な使用域とする方言は ja-JP-[VAR[大地域名]]-[VAR[*]] とし、[VAR[大地域名]]としては地域名 ([CODE[kansai]] など), 現行の47[[都道府県]]名, [[明治時代]]の旧[[国名]]くらいに制限し、それ以上の細かいものは地域的あるいは言語的に近いものの小分類としてはどうでしょう。 [24] ただ、[[大阪弁]]を [CODE(LANG)[ja-JP-oosaka]] にするのか [CODE(LANG)[ja-JP-kansai-oosaka]] にするのかみたいな話になりますが。 -[25] >>24 大阪弁は有名だから関西弁とは独立させてもいいかも・・。 だけど結局線引き問題は一杯出てきそう。 -[26] >>24 [CODE[oosaka]] より [CODE[osaka]] がイイとか言う意見もありそう。 -[27] [CODE[ja-Kana]] (片仮名) って嫌な名前だなぁ。 ISO 15924 の馬鹿野郎〜 -[28] >>27 こういうのもあると、「小学3年生に習う漢字まで」みたいなのも欲しい気がするが・・・。 -[29] >>28 そういうのを見ると、やぱーり用字系は別指定にしる! とか言いたい気がするが。。。 (この文は [CODE(LANG)[ja-2ch]] に札付けするのが(・∀・)イイ!!) -[31] >>27-29 といふことで[[用字系札]]に分離しませう。 (この文は [CODE(LANG)[ja-desumasu]]+[CODE(SCRIPT)[Japn-ja-old-kana]] にして下さると嬉しう存じます。) - [32] >>23-26 ラテン文字3〜4文字の[[都道府県名符号]]を使うのが良い。 - [33] [CODE(LANG)[ja-JP-TKY-shibuya-slang]] 渋谷の女子高生の言葉 - [34] >>33 特に時代を指定したければ [CODE(LANG)[ja-JP-TKY-shibuya-slang-2002]] とするとか。 - [36] -[40] [[XSL-FO]] では言語タグの登場場面である xml:[[lang]] 属性の値に [CODE(XSL)[inherit]] が指定できます。 ([[XML]] 的にそんなのありかよ? と思いますが) この値は [CODE(XML)[xml:lang]] 属性の既定値を明示した形になります。 (''Formatting Properties'' ) - [41] [CODE(lang)[ja-trad]]: : 正字正假名の日本語。 - [42] >>41 の使い方は言語と用字系の独立性を欠いてるからお勧めしがたいけど、手軽なのはいいことだ。 - [43] >>34 の書き方を使えば、2ch 閉鎖騒動の頃の言葉遣いを [CODE(lang)[ja-2ch-2001-08]] とか表せて(・∀・)イイ! [[#comment]] *参考文献 -[4] [[RFC1766]] -[5] [[RFC3066]] -[17] ''LANGUAGE TAGS'' --[18] ''Directory of language tag applications'' -[14] ''ISO 639 Joint Advisory Committee'' --[3] [639FAQ] ''ISO 639 Frequently Asked Questions (FAQ) '' -[15] ''ISO 639-1 Registration Authority'' -[16] ''ISO 639-2 Registration Authority - Library of Congress'' -[6] [[RFC2277]] IETF Policy on Character Sets and Languages (文字集合と言語についての IETF の方針) -[MOZILLA] [[Mozilla]] の実装 -[MSIE] [[M$IE]] の実装 -[21] [QUIALANG] ''lang 属性について [QUIA]'' [[#comment]] *メモ