#?SuikaWiki/0.9 [1] 言語札は [[RFC1766]] が定義していましたが、 [[RFC3066]] に改訂されました。 - [37] 非常に古い [[HTTP]] では、 RFC 1766 の [CODE(ABNF)["-"]] を使う方法ではなく [[POSIX]] の [[locale]] 名のように [CODE(ABNF)["_"]] で区切っていました。 ''Object Header lines in HTTP'' - [38] >>37 現在でも間違ってこちらが使われる可能性がありますから、実装は両方に対応しているといいかもしれません。 - [39] [[HTML]] 3.0 では [[lang]] 属性の値に [CODE(ABNF)["-"]] の代わりに [CODE(ABNF)["."]] を使っていました。 (''The Body Element and Related Elements'' ) - [47] 一部の [[DOM]] HTML 実装は、 [CODE(DOMa)[[[lang]]]] 属性の値で、 HTML の [CODE(HTML)[[[lang]]]] 属性に値が明示されていない時には [CODE(lang)[unknown]] を返すらしいです。 [[#comment]] *言語札の値 [2] 言語札の値で、 [[ISO639]] そのものでないものを集めます。 ,名前 ,言語 ,(札の)典拠 ,参考 ,ar-AE ,Arabic/UAE ,[MOZILLA] , ,ar-BH ,Arabic/Bahrain ,[MOZILLA] , ,ar-DZ ,Arabic/Algeria ,[MOZILLA] , ,ar-EG ,Arabic/Egypt ,[MOZILLA] , ,ar-IQ ,Arabic/Iraq ,[MOZILLA] , ,ar-JO ,Arabic/Jordan ,[MOZILLA] , ,ar-KW ,Arabic/Kuwait ,[MOZILLA] , ,ar-LB ,Arabic/Lebanon ,[MOZILLA] , ,ar-LY ,Arabic/Libya ,[MOZILLA] , ,ar-MA ,Arabic/Morocco ,[MOZILLA] , ,ar-OM ,Arabic/Oman ,[MOZILLA] , ,ar-QA ,Arabic/Qatar ,[MOZILLA] , ,ar-SA ,Arabic/Saudi Arabia ,[MOZILLA] , ,ar-SY ,Arabic/Syria ,[MOZILLA] , ,ar-TN ,Arabic/Tunisia ,[MOZILLA] , ,ar-YE ,Arabic/Yemen ,[MOZILLA] , ,art-lojban , ,[IANAREG] ,az-arabic ,アゼルバイジャン語(アラビア文字) ,[RFC 1766] ,az-cyrillic ,アゼルバイジャン語(キリル文字) ,[RFC 1766], ,bg-BG ,[[cel-gaulish]] , ,[IANAREG] , ,cs-CZ ,da-DK , , ,de-1901 , ,[IANAREG] , ,de-1996 , ,[IANAREG] , ,de-AT ,独語/Austria ,[MOZILLA] , ,de-AT-1901 , ,[IANAREG] , ,de-AT-1996 , ,[IANAREG] , ,de-CH ,独語/Switzerland ,[MOZILLA] , ,de-CH-1901 , ,[IANAREG] , ,de-CH-1996 , ,[IANAREG] , ,de-DE ,独語/Germany ,[MOZILLA] , ,de-DE-1901 , ,[IANAREG] , ,de-DE-1996 , ,[IANAREG] , ,de-LI ,独語/Liechtenstein ,[MOZILLA] , ,de-LU ,独語/Luxembourg ,[MOZILLA] , ,el-GR , , ,en-AU ,オーストラリア英語 ,[MOZILLA] , ,en-BZ ,英語/Belize ,[MOZILLA] , ,en-CA ,英語/Canada ,[MOZILLA] , ,[[en-CN]] ,[[チングリッシュ]] , , ,en-cockney ,ロンドン英語 ,[RFC 1766] , ,en-GB ,英語/Great Britain ,[MOZILLA] , ,[[english]] ,英語 , ,非標準 ,en-IE ,英語/Ireland ,[MOZILLA] , ,en-JM ,英語/Jamaica ,[MOZILLA] , ,en-JP ,[[ジャパニッシュ]] ,en-NZ ,英語/New Zealand ,[MOZILLA] , ,en-PH ,英語/フィリピン ,[MOZILLA] , ,en-securid ,[[en-scouse]] ,英語 Liverpool 方言 ,[IANAREG] , ,en-TT ,英語/Trinidad ,[MOZILLA] , ,en-US ,[[米語]] ,[RFC 3066] ,en-US-slang ,米俗語 ,[QUIALANG] (>>21) ,en-ZA ,英語/南アフリカ ,[MOZILLA] , ,en-ZW ,英語/Zimbabwe ,[MOZILLA] , ,[[english]] ,英語 , ,非標準 ->[CODE(lang)[en]] ,es-AR ,[RUBY[西班牙] [スペイン]]語/Argentina ,[MOZILLA] , ,es-BO ,西班牙語/Bolivia ,[MOZILLA] , ,es-CL ,西班牙語/Chile ,[MOZILLA] , ,es-CO ,西班牙語/Colombia ,[MOZILLA] , ,es-CR ,西班牙語/Costa Rica ,[MOZILLA] , ,es-DO ,西班牙語/ドミニカ共和国 ,[MOZILLA] , ,es-EC ,西班牙語/Ecuador ,[MOZILLA] , ,es-ES ,西班牙語/Spain ,[MOZILLA] , ,es-GT ,西班牙語/Guatemala ,[MOZILLA] , ,es-HN ,西班牙語/Honduras ,[MOZILLA] , ,es-MX ,西班牙語/Mexico ,[MOZILLA] , ,es-NI ,西班牙語/Nicaragua ,[MOZILLA] , ,es-PA ,西班牙語/Panama ,[MOZILLA] , ,es-PY ,西班牙語/Parguay ,[MOZILLA] , ,es-PE ,西班牙語/Peru ,[MOZILLA] , ,es-PR ,西班牙語/Puerto Rico ,[MOZILLA] , ,es-SV ,西班牙語/El Salvador ,[MOZILLA] , ,es-US ,西班牙語/合衆国 ,[MSIE] , ,es-UY ,西班牙語/Uruguay ,[MOZILLA] , ,es-VE ,西班牙語/Venezuela ,[MOZILLA] , ,fi-FI ,fr-BE ,仏語/Belgium ,[MOZILLA] , ,fr-CA ,仏語/Canada ,[MOZILLA] , ,fr-CH ,仏語/スイス ,[MOZILLA] , ,fr-FR ,仏語/仏蘭西 ,[MOZILLA] , ,fr-LU ,仏語/ルクセンブルク ,[MOZILLA] , ,fr-MC ,仏語/モナコ ,[MOZILLA] , ,ga-IE , , ,[[german]] ,独語 , ,非標準 ,he-IL ,hu-HU ,hr-HR , , ,i-ami , ,[IANAREG] , ,i-bnn , ,[IANAREG] , ,i-cherokee , ,[RFC 1766] , ,i-enochian , ,[IANAREG] , ,i-default ,''既定言語'' ,[[RFC2277]>>10647] [IANAREG] ,i-hak ,客家語 ,[IANAREG] ,非推奨 ([CODE(LANG)[zh-hakka]]) ,i-klingon , ,[IANAREG] , ,i-lux , ,[IANAREG] ,非推奨 ([CODE(LANG)[lb]]) ,i-mingo , ,[IANAREG] , ,i-navajo , ,[IANAREG] ,非推奨 ([CODE(LANG)[nv]]) ,i-pwn , ,[IANAREG] , ,i-sami-no ,北セミ語 ,[RFC 1766] , ,i-tao , ,[IANAREG] , ,i-tay , ,[IANAREG] , ,i-tsolyani, ,[[RFC3066]>>20] ,i-tsu , ,[IANAREG] , ,[[ie-ee]] ,it-CH ,伊語/Switzerland ,[MOZILLA] , ,it-IT ,伊太利亜語/伊太利亜 , ,ja-2ch ,日本語/にちゃんねる語 ,ja-JP ,日本語/日本 , ,[[RFC2482]] ,ja-classic ,日本語/古語 ,ja-classic-heian ,日本語/古語/平安時代 ,[[japanese]] ,日本語 , ,非標準 ->[CODE(lang)[ja]] ,ja-ryuukyuu ,琉球語 ,jp ,日本語 ,[WinIE3] ,非標準 ->[CODE(lang)[ja]] ,ko-KP ,朝鮮語/北朝鮮 ,[MOZILLA] , ,ko-KR ,韓語/韓国 ,[MOZILLA] , ,mk-MK ,マケドニア語/マケドニア ,[MOZILLA] , ,nl-BE ,オランダ語/ベルギー ,[MOZILLA] , ,nl-NL ,阿蘭陀語/阿蘭陀 , ,nb-NO ,諾威語/ブークモール ,[MSIE] , ,nn-NO ,新諾威語/諾威 ,[MSIE] , ,no-bok , ,[IANAREG] ,非推奨 ([CODE(LANG)[nb]]) ,no-nyn ,新[RUBY[諾威] [ノルウェイ]]語 ,[IANAREG] ,非推奨 ([CODE(LANG)[nn]]) ,no-nynorsk ,新諾威語 ,[RFC 1766] ,非推奨 ([CODE(LANG)[nn]]) ,[[pdf]] ,pl-PL ,pt-BR ,ポルトガル語/ブラジル ,[MOZILLA] ,pt-PT ,葡萄牙語/葡萄牙 , ,ro-MD ,ルーマニア語/モルドバ ,[MSIE] , ,ro-MO ,ルーマニア語/モルドバ , ,ro-RO ,[[rs1_0f95ec2efae]] , ,[[rs1_8df95f00fe7]] ,[[rs1_99f5378fdc8]] ,[[rs1_e57594a483d]] ,[[rs2_343a1afa0c0]] ,[[rs2_411d6877f00]] ,[[rs2_a4a1eae08aa]] ,[[rs2_b4375ad4940]] ,[[rs3_10c6009cdd]] ,[[rs3_a0eeaf5a3a]] ,[[rs3_bb351f7151]] ,[[rs3_edd4a8fbe1]] ,ru-MD ,露西亜語/モルドバ ,[MSIE] , ,ru-MO ,露西亜語/モルドバ , ,ru-RU ,露西亜語/露西亜 , ,sgn-BE-fr , ,[IANAREG] , ,sgn-BE-nl , ,[IANAREG] , ,sgn-BR , ,[IANAREG] , ,sgn-CH-de , ,[IANAREG] , ,sgn-CO , ,[IANAREG] , ,sgn-DE , ,[IANAREG] , ,sgn-DK , ,[IANAREG] , ,sgn-ES , ,[IANAREG] , ,sgn-FR , ,[IANAREG] , ,sgn-GB , ,[IANAREG] , ,sgn-GR , ,[IANAREG] , ,sgn-IE , ,[IANAREG] , ,sgn-IT , ,[IANAREG] , ,sgn-JP , ,[IANAREG] , ,sgn-MX , ,[IANAREG] , ,sgn-NL , ,[IANAREG] , ,sgn-NO , ,[IANAREG] , ,sgn-PT , ,[IANAREG] , ,sgn-SE , ,[IANAREG] , ,sgn-US , ,[IANAREG] , ,sgn-US-MA,マーサズ[RUBY[葡萄園] [ヴィンヤード]]島の手話,[[RFC3066]>>19] ,sgn-ZA , ,[IANAREG] , ,sk-SK ,sr-YU ,sv-FI ,瑞典語/[RUBY[芬蘭] [フィンランド]] ,[MOZILLA] , ,sv-SE , , ,[[teamemh]] , , ,非標準 ,th-TH ,泰語/泰 , ,tr-TR , , ,uk-UA ,vi-VN , , ,x-ainu ,[[アイヌ語]] ,x-pig-latin , ,[[RFC2616]] , ,x-klingon ,クリンゴン語 ,[RFC 1766] ,非推奨 ([CODE(LANG)[i-klingon]]) ,zh-CN ,中文/中華大陸 ,[MOZILLA] , ,zh-gan , ,[IANAREG] , ,zh-guoyu , ,[IANAREG] , ,zh-hakka ,[[客家語]] ,[IANAREG] , ,zh-HK ,中文/[[香港]] ,[MOZILLA] , ,zh-mandarin ,[[中文]][[官話方言]] ,[639FAQ] (>>3) ,zh-min , ,[IANAREG] , ,zh-min-nan , ,[IANAREG] , ,zh-MO ,中文/[RUBY[澳門] [マカオ]] ,[MSIE] , ,zh-SG ,中文/[RUBY[新加坡] [シンガポール]] ,[MOZILLA] , ,zh-TW ,中文/台湾 ,[MOZILLA] , ,zh-wuu , ,[IANAREG] , ,zh-xiang , ,[IANAREG] , ,zh-yue , ,[IANAREG] , ,[[英語-(U.S)]] ,英語/亜米利加合衆国 , ,非標準 ->[CODE(lang)[en-US]] ,[[日本語]] ,日本語 , ,非標準 ->[CODE(lang)[ja]] ,[[最近、串が腐り始めたような^^;]] ,(偽装) , ,非標準 [[#form:'%text(lavel=>札,id=>tag); %text(label=>言語名,id=>langname); %text(id=>src,label=>典拠,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',%text(source=>tag); ,%text(source=>langname); ,"%text(source=>src); ","%text(source=>comment);"']] [22] RFC 3066 によれば、第2小札以降は文法規則 (特に、字数制限: 3〜8文字に注意) に従う限り自由に使っていいことになっています。このため言語札の一意性は保障されないでしょう。 もっとも言語はそう簡単に増えたり減ったりするものではないですから、滅多なことでは衝突しないでしょうが・・・。 - [44] しかし衝突はしなくても、同じ言語/方言を表す名前が複数存在してしまうことになりかねません。 - [45] 言語札のレベルでは解決できない問題として、言語/方言の区分の方法による非一意性もあります。 >>25 の大阪弁/関西弁問題や、台湾の外省人の言語が北京語と同じなのか (違うかな。) とか。 - [46] >>45 でも中国で北京語といったら北京方言のことで、官話方言のことじゃないそうですね。日本語共通語と山手方言とか江戸っ子言葉の関係みたいなもん? - [48] 手元の [[WinIE]] 1.0〜3 は [CODE(lang)[[[jp]]]] という間違った値を送ります。 [[#comment]] *用字系の識別 [19] RFC 1766 は[[用字系]]の識別までを含めた例として [CODE(LANG)[az-arabic]] と [CODE(LANG)[az-cyrillic]] を挙げていますが、 RFC 3066 にはそのような用途の例示さえありません。 [639FAQ] (>>3) は用字系の識別には言語符号より [[ISO15924]] を使うようにと言っているのと関係があるかもしれません (しないかもしれません)。 [20] しかしなんにせよ用字系の指定も含めた言語札が使えた方が、 (用字系を別途指定出来る規格なんて多分ないので) 良いと思います。 - [30] [[正書法]]がどうこうを含んだ奴は用字系込みに近いよな。違うことは違うが。 - [35] >>19-30 [[用字系札]]を使えるようにしる! [[#comment]] *ja-* について [23] 日本語の方言にも星の数ほど種類がありますから、全部 ja-[VAR[foo]] にすると大変なことになります。 一つの提案として、[[日本国]]内の地域を主要な使用域とする方言は ja-JP-[VAR[大地域名]]-[VAR[*]] とし、[VAR[大地域名]]としては地域名 ([CODE[kansai]] など), 現行の47[[都道府県]]名, [[明治時代]]の旧[[国名]]くらいに制限し、それ以上の細かいものは地域的あるいは言語的に近いものの小分類としてはどうでしょう。 [24] ただ、[[大阪弁]]を [CODE(LANG)[ja-JP-oosaka]] にするのか [CODE(LANG)[ja-JP-kansai-oosaka]] にするのかみたいな話になりますが。 -[25] >>24 大阪弁は有名だから関西弁とは独立させてもいいかも・・。 だけど結局線引き問題は一杯出てきそう。 -[26] >>24 [CODE[oosaka]] より [CODE[osaka]] がイイとか言う意見もありそう。 -[27] [CODE[ja-Kana]] (片仮名) って嫌な名前だなぁ。 ISO 15924 の馬鹿野郎〜 -[28] >>27 こういうのもあると、「小学3年生に習う漢字まで」みたいなのも欲しい気がするが・・・。 -[29] >>28 そういうのを見ると、やぱーり用字系は別指定にしる! とか言いたい気がするが。。。 (この文は [CODE(LANG)[ja-2ch]] に札付けするのが(・∀・)イイ!!) -[31] >>27-29 といふことで[[用字系札]]に分離しませう。 (この文は [CODE(LANG)[ja-desumasu]]+[CODE(SCRIPT)[Japn-ja-old-kana]] にして下さると嬉しう存じます。) - [32] >>23-26 ラテン文字3〜4文字の[[都道府県名符号]]を使うのが良い。 - [33] [CODE(LANG)[ja-JP-TKY-shibuya-slang]] 渋谷の女子高生の言葉 - [34] >>33 特に時代を指定したければ [CODE(LANG)[ja-JP-TKY-shibuya-slang-2002]] とするとか。 - [36] -[40] [[XSL-FO]] では言語タグの登場場面である xml:[[lang]] 属性の値に [CODE(XSL)[inherit]] が指定できます。 ([[XML]] 的にそんなのありかよ? と思いますが) この値は [CODE(XML)[xml:lang]] 属性の既定値を明示した形になります。 (''Formatting Properties'' ) - [41] [CODE(lang)[ja-trad]]: : 正字正假名の日本語。 - [42] >>41 の使い方は言語と用字系の独立性を欠いてるからお勧めしがたいけど、手軽なのはいいことだ。 - [43] >>34 の書き方を使えば、2ch 閉鎖騒動の頃の言葉遣いを [CODE(lang)[ja-2ch-2001-08]] とか表せて(・∀・)イイ! [[#comment]] * 仕様書から ** RFC 2068・2616 (HTTP/1.1) 3.10 Language Tags > A language tag identifies a natural language spoken, written, or otherwise conveyed by human beings for communication of information to other human beings. Computer languages are explicitly excluded. HTTP uses language tags within the Accept-Language and Content-Language fields. [DFN[言語札識別子]]は、人間が他の人間と情報の通信をするために話したり書いたりその他伝達する自然言語を識別します。 計算機言語は陽に除外します。 HTTP は [CODE(HTTP)[[[Accept-Language]]]] 欄と [CODE(HTTP)[[[Content-Language]]]] 欄の中で言語札を使います。 > The syntax and registry of HTTP language tags is the same as that defined by RFC 1766 [1]. In summary, a language tag is composed of 1 or more parts: A primary language tag and a possibly empty series of subtags: HTTP 言語札の構文と登録簿は [[RFC1766]] で定義されているものと同じです。 要約すると、言語札は一つ以上の部分の組合せ、すなわち 主言語札と空かもしれない部分札の系列です。 > -language-tag = primary-tag *( "-" subtag ) -primary-tag = 1*8ALPHA -[DEL[[INS[{2068,2616}]] subtag = 1*8ALPHA]] -[INS[[INS[{Errata}]] subtag = 1*8(ALPHA / DIGIT)]] > White[INS[ ]]space is not allowed within the tag and all tags are case-insensitive. The name space of language tags is administered by the IANA. Example tags include: [[空白]]は札の中では認められず、すべての札は大文字・小文字を区別しません。 言語札の名前空間は [[IANA]] で管理します。札の例: > en, en-US, en-cockney, i-cherokee, x-pig-latin > where any two-letter primary-tag is an ISO[INS[-]]639 language abbreviation and any two-letter initial subtag is an ISO[INS[-]]3166 country code. (The last three tags above are not registered tags; all but the last are examples of tags which could be registered in future.) ここで、2文字の主札は [[ISO639]] の言語の略語で、 2文字の最初の部分札は [[ISO3166]] 国名符号です。 (上の最後の3つの札は登録されていない札です。最後のもの以外は将来登録されるかもしれない例です。) ** RFC の部分のライセンス [[RFCのライセンス]] *参考文献 -[4] [[RFC1766]] -[5] [[RFC3066]] -[17] ''LANGUAGE TAGS'' --[18] ''Directory of language tag applications'' -[14] ''ISO 639 Joint Advisory Committee'' --[3] [639FAQ] ''ISO 639 Frequently Asked Questions (FAQ) '' -[15] ''ISO 639-1 Registration Authority'' -[16] ''ISO 639-2 Registration Authority - Library of Congress'' -[6] [[RFC2277]] IETF Policy on Character Sets and Languages (文字集合と言語についての IETF の方針) -[MOZILLA] [[Mozilla]] の実装 -[MSIE] [[M$IE]] の実装 -[21] [QUIALANG] ''lang 属性について [QUIA]'' - [49] [WEAK[2003-09-21 05:31:40 +00:00]] ''[[名無しさん]]'': ''スラッシュドット ジャパン | 国コードや言語コードなどに課金?'' [[#comment]] *メモ