[71] [DFN[[RUBYB[言語タグ]@en[language tag]]]]は、[[自然言語]]を識別するための短い[[文字列]]です。
[[ISO]] の定める[[言語符号]]などの組み合わせにより様々な[[言語]]や[[言語]]と[[地域]]や[[用字系]]などの組み合わせによるバリエーションを表現することができます。
[[言語タグ]]は [[IETF]] により [[BCP 47]] として標準化されており、様々な [[IETF]]
の[[プロトコル]]の他 [[HTML]] や [[CSS]] などの [[Web標準]]でも広く使われています。

* 仕様書

[REFS[
- [72] [CITE@en[RFC 5646 - Tags for Identifying Languages]]
<http://tools.ietf.org/html/rfc5646>
- [73] [CITE@en[RFC 4647 - Matching of Language Tags]] ([TIME[2011-06-26 10:41:18 +09:00]] 版) <http://tools.ietf.org/html/rfc4647>
- [74] [CITE[Language Subtag Registry]]
<http://www.iana.org/assignments/language-subtag-registry>
- [75] [CITE@en[IANA | Language Subtag Registry - Registration Templates]]
<http://www.iana.org/assignments/lang-subtags-templates/index.html>
- [76] [CITE[Language Tag Extensions Registry]] 
<http://www.iana.org/assignments/language-tag-extensions-registry>
]REFS]

[191] [[IETF]] として初めて[[言語タグ]]を規定した最初の正式な仕様は [[RFC 1766]]
でしたが、 [[RFC 3066]]、[[RFC 4646]] を経て [[RFC 5646]] が現行仕様となっています。
[[RFC 3066]] と [[RFC 4646]] の間に大規模な非互換変更が行われています。 
(詳しくは歴史の項を参照してください。)

** BCP 47

[84] [[IETF]] [DFN[[[BCP 47]]]] は、現在 [[RFC 5646]] と [[RFC 4647]] により構成されています [SRC[>>72 1.]]。

** IANA 登録簿

[188] [[言語タグ]]で使うことができる[[部分タグ]]や[[祖父化]][[言語タグ]]は [[IANA]]
の登録簿があります (>>74、>>76)。

[189] [[RFC 1766]] や [[RFC 3066]] の時代は [[ISO]] 
の仕様から導出できない追加の[[言語タグ]]を登録してもよいという形でしたが、
[[RFC 4646]] 以降は原則としてすべて登録簿にある[[部分タグ]]を組み合わせて使う形に改められています。

[190] [[RFC 3066]] までの時代の登録簿は機械処理には適さない文書でしたが、
[[RFC 4646]] 以降は機械処理可能な形式になっています。
その書式は [[RFC 4646]] 3. で規定されていましたが、 (非互換に) 変更されて現在は
[[RFC 5646]] 3. で規定されています。

* 構文

[55]
[DFN[[RUBYB[[[言語タグ]]]@en[language tag]]]]は、
1つ以上の[RUBY[[[部分タグ]]] @en[subtag]]を
[CODE(charname)@en[[[HYPHEN-MINUS]]]] ([CODE(char)[[[-]]]])
で連結した[[文字列]]です。

[EG[
例えば、
[PRE(lang example code)[
ja-Latn-US
]PRE]
... は、3つの[[部分タグ]]から構成される[[言語タグ]]です。狭義の[[言語]]が[[日本語]]
([CODE(lang)[[[ja]]]]) であって、[[ラテン文字]]という[[用字系]]
([CODE(lang)[[[Latn]]]]) によって表記され、[[アメリカ合衆国]]という[[地域]]
([CODE(lang)[[[US]]]]) で用いられている[[言語]]を表しています。
]EG]

** 部分タグ

[56]
[DFN[[RUBYB[[[部分タグ]]]@en[subtag]]]]は、 (狭義の) [[言語]]や[[地域]]などを表す[[文字列]]です。
[[部分タグ]]を複数組み合わせて細かく指定できます。
[[部分タグ]]の長さや位置は、それが何を表すかによって決まっています。
[SRC@en[[[RFC 4646]] 2.1.]]

[FIG[
[FIGCAPTION[
[[部分タグ]]の種類
]FIGCAPTION]
- [[言語部分タグ]]
- [[拡張言語部分タグ]]
- [[用字系部分タグ]]
- [[地域部分タグ]]
- [[変種部分タグ]]
- [[拡張部分タグ]]
]FIG]

[281] [[言語タグ]]の変種である[[Unicode言語識別子]]、[[Unicodeロケール識別子]]は[[部分タグ]]のことを
「[DFN[[RUBYB[[[符号]]]@en[code]]]]」とも呼んでいます。

[REFS[
- [282] [CITE@en-us[UTS #35: Unicode Locale Data Markup Language]] ([TIME[2011-07-19 03:14:51 +09:00]] 版) <http://unicode.org/reports/tr35/#Unicode_Language_and_Locale_Identifiers>
]REFS]

;; [283] 実際に[[部分タグ]]として使われているのは [[ISO]] の仕様によって定められた[[言語符号]]や[[国符号]]だったりするので、
「[[符号]]」と呼びたくなるのも理解できます。

** 大文字と小文字

[58] [[言語タグ]]の ([[ASCII]] の) [[大文字]]と[[小文字]]は、区別''されません''。
[SRC@en[[[RFC 4646]] 2.1., [[RFC 5646]] 2.2.1.]]

[59] 区別はされませんが、 [[IANA]] 登録簿の書式が[['''推奨''']]されています。
[SRC@en[[[RFC 4646]] 2.1., [[RFC 5646]] 2.2.1.]]
[FIG[
- 1つ目''以外''の2[[文字]]の[[部分札]]は、すべて[[大文字]]にします。
- 1つ目''以外''の4[[文字]]の[[部分札]]は、先頭だけ[[大文字]]にします。
- それ以外のすべての[[部分札]]は、[[小文字]]にします。
]FIG]

;; 
[60]
これは、 [[ISO 639-1]] の[[言語符号]]がすべて[[小文字]]、
[[ISO 3166-1]] の[[国名符号]]がすべて[[大文字]]、
[[ISO 15924]] の[[用字系符号]]が先頭だけ[[大文字]]が推奨されていることに由来します。

[164] [[拡張]]の[[部分タグ]]については、すべて[[小文字]]に[[正規化]]されることが期待されています。
[SRC[[[RFC 5646]] 2.2.6.]]

;; [296] [[拡張]]「[CODE(lang)@en[[[t]]]]」は[[拡張]]の一部として[[言語タグ]]を含めることができますが、
その場合の[[正規形]]は、[[地域]]や[[用字系]]も含めてすべて[[小文字]]とされています。

** 長さ

[231] [[言語タグ]]には長さ制限はありません。一般的には6文字程度に収まりますが、
それより長い[[言語タグ]]もあります。
[SRC[[[RFC 4646]] 4.3., [[RFC 5646]] 4.4.]]

[232] [[プロトコル]]等で長さを制限する場合であっても、最低35文字は認め[['''なければなりません''']]。
[SRC[[[RFC 5646]] 4.4.]]

;; [233] [[RFC 4646]] 4.3. では最低42文字とされていましたが、[[拡張言語]]の仕様が確定したため緩和されました。

[234] 実装や仕様は長い[[言語タグ]]を扱えなくても構いませんが、
何文字まで扱えるのか、長すぎる時にどうなるのかを文書化する[['''べきです''']]。
また実装は長すぎる時に警告する[['''べきです''']]。
[SRC[[[RFC 4646]] 4.3., [[RFC 5646]] 4.4.]]

[235] 実装は長い[[言語タグ]]を切り落としていく時に、[[部分タグ]]の途中でぶった切っては[['''なりません''']]。
[SRC[[[RFC 4646]] 4.3., [[RFC 5646]] 4.4.]]

[EG[
[236] 長い[[言語タグ]]を切り落としていく例 [SRC[[[RFC 4646]] 4.3., [[RFC 5646]] 4.4.]]
- [CODE(lang)[zh-Latn-CN-variant1-a-extend1-x-wadegile-private1]]
- [CODE(lang)[zh-Latn-CN-variant1-a-extend1-x-wadegile]]
- [CODE(lang)[zh-Latn-CN-variant1-a-extend1]]
- [CODE(lang)[zh-Latn-CN-variant1]]
- [CODE(lang)[zh-Latn-CN]]
- [CODE(lang)[zh-Latn]]
- [CODE(lang)[zh]]
]EG]

** 歴史

[268] [[RFC 1766]] では、構文は制限が緩い単純なもので、
- [[部分タグ]]を [CODE(char)[[[-]]]] で連結する
- [[部分タグ]]は1文字から8文字の[[ラテン文字]]

... という制限しかありませんでした [SRC[[[RFC 1766]] 2.]]。

[260] [[RFC 3066]] では、[[数字]]が認められて、
- [[部分タグ]]を [CODE(char)[[[-]]]] で連結する
- [[部分タグ]]は1文字から8文字の[[英数字]]

... という制限になりました [SRC[[[RFC 3066]] 2.1]]。

* 拡張部分タグ

[155] [DFN[[RUBYB[[[拡張]]] @en[[CODE(ABNF)[extension]]]]]]は、
[[言語]]や[[言語タグ]]と併用される、[[言語]]以外の情報を表すために使える[[言語タグ]]の拡張機構です。
[SRC[[[RFC 4646]] 2.2.6., [[RFC 5646]] 2.2.6.]]

;; [297] [[数値]]の表現、[[暦]]、[[照合順序]]といったような[[ロケール]]情報は、
広い意味では[[言語]]を構成する要素ではありますが、[[言語タグ]]本体仕様には含まれておらず、
[[拡張]]として記述する必要があります。

[158] [[拡張]]は[[言語]]、[[拡張言語]]、[[用字系]]、[[地域]]、[[異体]]の後で、
[[私用]]の前に[['''なければなりません''']]。
[[言語タグ]]全体が[[私用]]であって [CODE(lang)[[[x-]]]] から始まる場合には[[拡張]]を使うことはできません。
[SRC[[[RFC 4646]] 2.2.6., [[RFC 5646]] 2.2.6.]]

[159] [[拡張]]は複数個含めることができますが、同じ種類 (singleton) 
の[[拡張]]を複数個同時に含めては[['''なりません''']]。
[SRC[[[RFC 4646]] 2.2.6., [[RFC 5646]] 2.2.6.]]

[163] [[拡張]]の順序は[[大文字・小文字不区別]]の[[ASCII]]順に[[正準化]]する[['''べきです''']]。
[SRC[[[RFC 4646]] 2.2.6., 4.4., [[RFC 5646]] 2.2.6., 4.5.]]
順序に意味は無いようです。

;; [298] [[拡張]]によっては更に[[正規化]]する方法が規定されています。

[161] [[拡張]]は、 [[singleton]] と呼ばれる1文字の[[部分タグ]]と、
それに続く1個以上の2-8文字の[[英数字]]の[[部分タグ]]により構成されます。
[[singleton]] は[[拡張]]の種類を表すものであり、 [[IANA]]
に登録しなけてば[['''なりません''']]。
続きの[[部分タグ]]は、その[[拡張]]の仕様に従わなければ[['''なりません''']]。
[SRC[[[RFC 4646]] 2.2.6., [[RFC 5646]] 2.2.6.]]
[[拡張]]は続きの[[部分タグ]]を構文の制約の元で自由に使うことができます。
[[拡張]]が[RUBYB[[[妥当]]]@en[valid]]であるかどうかは、その仕様によって定められます
[SRC[[[RFC 5646]] 2.2.9.]]。

;; [162] [CODE(lang)[[[x]]]] や [CODE(lang)[[[i]]]] は[[拡張]]を表す [[singleton]]
ではありません。

** 一覧

- [284] [CODE(lang)[[[t]]]] : 変換
- [68] [CODE(lang)@en[[[u]]]] : [[UTS #35]] [[ロケール]]識別子

** 歴史

[157] [[拡張]]は [[RFC 4646]] で導入されました。それ以前は同様の仕組みはありませんでした。

[289] [CODE(lang)@en[[[t]]]] は2011年12月16日付で[[IANA]]に登録されています。

* 私用部分タグ

[165] [RUBYB[[[私用]]] @en[[CODE(ABNF)[private use]]]][[部分タグ]]は、
特定の文脈で私的な合意の元に意味のある言語の区別を示すものです、
[SRC[[[RFC 4646]] 2.2.7., [[RFC 5646]] 2.2.7.]]
私用の部分タグは登録なしに自由に使うことができますが、
合意の範囲外では意味を共有することができませんし、
異なる当事者間の同意により同じ文字列が異なる意味で理解されることもあり得ます。

[166] [CODE(lang)[[[x]]]] だけの1文字の[[部分タグ]]の後に1つ以上の[[私用]]の[[部分タグ]]を使うことができます。
[[私用]]の[[部分タグ]]は1文字以上8文字以下の任意の[[英数字]]の列です。
[SRC[[[RFC 4646]] 2.2.7., [[RFC 5646]] 2.2.7.]]

;; [167] [[私用]]の[[部分タグ]]は、たとえ[[言語]]や[[地域]]の[[部分タグ]]と同じように見えたとしても、
(当事者間でそのように合意していない限り) その[[言語]]や[[地域]]を意味しません。
[CODE(lang)[[[en-US]]]] と [CODE(lang)[[[en-X-US]]]] は同じ言語を表すとは限りません。

[168] [[私用]]の[[部分タグ]]は他の[[部分タグ]]より後になければ[['''なりません''']]。
[[言語]][[部分タグ]]なしで[[私用]]の[[部分タグ]]だけを使うこともできます。
[SRC[[[RFC 4646]] 2.2.7., [[RFC 5646]] 2.2.7.]]

[169] 他に候補がある場合や一般的な情報交換に供する場合には[[私用]]の[[部分タグ]]を使う[['''べきではありません''']]。
[SRC[[[RFC 4646]] 2.2.7., 4.5., [[RFC 5646]] 2.2.7., 4.6.]]

[170] [[言語]][[部分タグ]]や[[地域]][[部分タグ]]などにもそれぞれ[[私用]]に割り当てられた[[部分タグ]]がありますが、
それらはここでいう[[私用]]の[[部分タグ]]とは別のものです。
[[私用]]に割り当てられた[[部分タグ]]は[[言語タグ]]仕様上、それぞれ[[言語]]、[[地域]]などの意味を保持していますが、
ここでいう[[私用]]の[[部分タグ]]は[[言語タグ]]仕様上不透明なものです。
従って[[私用]][[部分タグ]]よりは[[私用]]に割り当てられた各種の[[部分タグ]]を使う[['''べきである''']]
[SRC[[[RFC 4646]] 4.5., [[RFC 5646]] 4.6.]] とされています。

[183] [[利用者]]は、[[私用]][[部分タグ]]を除き、 [[IANA]]
に登録されていない[[部分タグ]]を使っては[['''なりません''']]。
[SRC[[[RFC 5646]] 2.2.9.]]

[299] [[拡張]]によってはその一部を[[私用]]としていることがあります。

** 歴史

[171] [[RFC 1766]] と [[RFC 3066]] では、1つ目の[[部分タグ]] 
[WEAK[(当時の用語でいう[RUBYB[一次タグ][primary tag]])]] を
[CODE(lang)[[[x]]]] とすることで[[私用]]を表していました。
2つ目の[[部分タグ]] [WEAK[(当時の用語でいう最初の[RUBYB[部分タグ]@en[subtag]])]]
について、 [[RFC 1766]] では何も規定がなく、 [[RFC 3066]]
では1文字のものは将来の拡張のために予約するとされていました。
3つ目以降の[[部分タグ]]については特に制約なく、 [CODE(lang)[[[x]]]]
を使ったり登録したりすることも認められていました (特に[[私用]]という意味は割り当てられていませんでした)。

[172] [[RFC 4646]] 以後、[[私用]]を表す[[部分タグ]]の最初に使うという意味になっています。

* 祖父化言語タグ

[57] [[RFC 1766]] や [[RFC 3066]] の時代に登録された[[言語タグ]]の中には、
[[RFC 4646]] 以後の[[部分タグ]]の定義に従っていないものがありますが、
それも互換性のため引き続き [[RFC 4646]] 以後の仕様でも使うことが認められています
[SRC[[[RFC 4646]] 2.2.8., [[RFC 5646]] 2.2.8.]]。

[85] [[RFC 4646]] は特別に
[PRE(ABNF code)[
grandfathered = 1*3[[ALPHA]] 1*2("-" 2*8([[ALPHA]] / [[DIGIT]]))
]PRE]
... という構文を認めていました [SRC@en[[[RFC 4646]] 2.1.]]。

[86] ところがこれでは [[RFC 4646]] 以後のより制限が厳しい構文で認めていないものがこちらの構文では認められることになってしまい、
構文の定義として意味をなしていない状態でした。

[87] [[RFC 5646]] では [[RFC 3066]] までに登録されたものを構文定義に列挙する形となっており、
この問題は解消しています。

;; [88] これによって [[RFC 3066]] 時代までに未登録で利用され、 [[RFC 4646]]
以後定義に沿わないことにされてしまった[[言語タグ]]は [[RFC 5646]] の構文に適合しなくなってしまいました。
とはいえ、 [[RFC 4646]] の時に既に [[RFC]] 本文の定義に合致しない状態だったのですが。

[89] [[RFC 5646]] では、新しい構文に一致しないものの例外的に認めているもの (irregular) と、
新しい構文に一致するものの新しい構文から導かれる意味と違う意味で解釈されるべきもの
(regular) の2種類に分類されています。 [SRC[[[RFC 5646]] 2.1., 2.2.8.]]

[90] 
[FIG[
"en-GB-oed" / "i-ami" / "i-bnn" / "i-default" / "i-enochian" / "i-hak" / "i-klingon"
/ "i-lux" / "i-mingo" / "i-navajo" / "i-pwn" / "i-tao" / "i-tay" / "i-tsu" / "sgn-BE-FR"
/ "sgn-BE-NL" / "sgn-CH-DE"

[FIGCAPTION[
[CODE(ABNF)@en[irregular]] に分類されている[[言語タグ]]
]FIGCAPTION]
]FIG]

[91] 
[FIG[
"art-lojban" / "cel-gaulish" / "no-bok" / "no-nyn" / "zh-guoyu"
/ "zh-hakka" / "zh-min" / "zh-min-nan" / "zh-xiang"

[FIGCAPTION[
[CODE(ABNF)@en[regular]] に分類されている[[言語タグ]]
]FIGCAPTION]
]FIG]

[174] [CODE(lang)[[[en-GB-oed]]]] は[[英語]]の一種ですが、それ以外は単独の[[言語]]を表しています。
その多くは単独の一次[[言語]][[部分タグ]]が新たに割り当てられており、
[[IANA]] 登録簿の [[Preferred-Value]] に示されています
[SRC[[[RFC 4646]] 2.2.8., [[RFC 5646]] 2.2.8.]]。

[175] なお、 [[RFC 4646]] で[[祖父化]]に分類されていた[[言語タグ]]のうちの幾つかは、
[[RFC 5646]] のもとでは[[言語]]と[[拡張言語]]の組み合わせと解されるため、
[[冗長]]に再分類されています。

[300] [CODE(lang)@en[[[t]]]] [[拡張]]は[[言語タグ]]をその一部として含めることができますが、
[CODE(ABNF)@en[irregular]] の使用は禁止されています。

** [CODE(lang)[i-default]]

[228] [CODE(lang)[[[i-default]]]] は、既定の[[言語]]を示すことが要求されている場合を除き、
使う[['''べきではありません''']]。
[SRC[[[RFC 5646]] 4.1.]]

* 冗長言語タグ

[173] [[RFC 1766]] や [[RFC 3066]] に基づく手続きにより [[IANA]] に登録された[[言語タグ]]の中には、
[[RFC 4646]] 以後の仕組みに基づかず[RUBYB[[[祖父化]]]@en[grandfathered]]扱いされているものの他、
[CODE(lang)[[[zh-Hant]]]] のように [[RFC 4646]] 
以後の[[部分タグ]]の組み合わせで表現できるものがいくつもあります。
このような[[言語タグ]]もまた [[RFC 4646]] 以後の [[IANA]]
登録簿に含まれており、「[RUBYB[冗長]@en[redundant]]」と分類されています
[SRC[[[RFC 4646]] 2.2.8., [[RFC 5646]] 2.2.8.]]。

* 部分タグの選択

[213] 大原則として、[[言語タグ]]を構成する時は、可能な限りで粗すぎず、細かすぎない、
必要十分な粒度で言語を特定できるように[[部分タグ]]を選択するべきです。
[SRC[[[RFC 4646]] 4.1., [[RFC 5646]] 4.1.]]

[EG[
[214] 例えば、殆どの場合 [CODE(lang)[[[de-CH-1996]]]] (1996年正書法) は細かすぎで、
[CODE(lang)[[[de-CH]]]] で十分です。
]EG]

[EG[
[215] 普通は [CODE(lang)[[[gem]]]] ([[ゲルマン語族]]) は粗過ぎで、
それが (例えば) [[ドイツ語]]とわかっているなら [CODE(lang)[[[de]]]]
を使うべきです。
]EG]

** 非推奨

[194] [[IANA]] 登録簿には [[Deprecated]] ([[非推奨]]) 欄があります。
[WEAK[(値は非推奨になった日付です。)]]
[SRC[[[RFC 4646]] 3.1., [[RFC 5646]] 3.1.2.]]。

[202] [[妥当性]]を検証する実装は[[非推奨]]な[[部分タグ]]や[[タグ]]を使う[['''べきではありません''']]
[SRC[[[RFC 4646]] 3.1., 4.4., [[RFC 5646]] 3.1.6., 4.5.]]。

[203] [[非推奨]]な[[部分タグ]]や[[言語タグ]]には好ましい値が指定されていることもあれば、
指定されていない (代替がない) こともあります。

** 好ましい値

[195] [[IANA]] 登録簿には [[Preferred-Value]] (好ましい値) 欄があります。
[SRC[[[RFC 4646]] 3.1., [[RFC 5646]] 3.1.2.]]。

- [196] [[言語]]、[[用字系]]、[[地域]]、[[異体]]については、より好ましい別の値 (同じ種類の[[部分タグ]]) が指定されています。
[SRC[[[RFC 5646]] 3.1.2.]]
- [197] [[拡張言語]]、[[祖父化]]、[[冗長]]については、より好ましい[[拡張言語範囲]]が指定されています。
[SRC[[[RFC 5646]] 3.1.2.]]

;; [198] [[RFC 4646]] 3.1. では、[[拡張言語]]は >>196 に分類されていました。また >>197
は[[拡張言語範囲]]ではなく、「完全な[[言語タグ]]」とされていました。

[204] [[非推奨]]かつ好ましい値が指定されている場合にあっては、
好ましい値が最善の選択として利用される[['''べきです''']]。
[[拡張言語]]以外で好ましい値が指定されているなら、必ず[[非推奨]]でもあります。
[SRC[[[RFC 4646]] 3.1., [[RFC 5646]] 3.1.7.]]

[205] なお、好ましい値は必ずしも意味的に等価ではありません。例えば[[地域]]の[[部分タグ]]は[[国]]の独立などがあって変化した時に新しい[[国]]の符号が好ましいとされますが、
必ずしも以前の[[国]]と同じ範囲ではありません。

;; [265] [[RFC 3066]] 以前に登録された [CODE(lang)[[[i-*]]]] 形式の[[言語タグ]]の多くは、
現在では [[ISO]] の[[言語符号]]が割り当てられていて、そちらを使うのが好ましいとされています。
[[RFC 3066]] の当時も、 [[ISO]] の[[言語符号]]が割り当てられたらそちらを使わなければ[['''ならない''']]
[SRC[[[RFC 3066]] 2.3]] とされていました。

** 接頭辞

[199] [[IANA]] 登録簿には [[Prefix]] (接頭辞) 欄があります。
その値は、当該[[部分タグ]]を使う時に[[接頭辞]]となっている[['''べき''']][[言語タグ]]です。
[WEAK[(接頭辞となっているか否かは、[[拡張濾過]]算法に拠ります。)]]
接頭辞は[[拡張言語]]と[[異体]]の登録にのみ含まれます。
[SRC[[[RFC 4646]] 3.1., [[RFC 5646]] 3.1.2., 3.1.8.]]。

[EG[
[206] 例えば [CODE(lang)[[[cmn]]]] ([[官話]]) [[拡張言語]][[部分タグ]]の[[接頭辞]]は
[CODE(lang)[[[zh]]]] ([[中文]]) となっているので、 [CODE(lang)[[[zh-cmn]]]]
とするべきであり、 [CODE(lang)[[[ja-cmn]]]] は不適当です。
]EG]

[EG[
[277] [[Prefix]] に一致するかどうかは[[拡張濾過]]算法により判断されるので、
必ずしも文字列として接頭辞になっていなくても構いません。例えば
[CODE(lang)[es-Latn-CO-x-private]] に [CODE(lang)[es-CO]] は接頭辞として含まれています。
]EG]

* 正規化と比較

** 正準形

[237] [[言語タグ]]は[RUBYB[[[正準形]]]@en[canonical form]]である[['''べきです''']]。
[SRC[[[RFC 4646]] 4.4., [[RFC 5646]] 4.5.]]

[238] [[整形式]][[言語タグ]]は次の手順で[[正準化]]できます
[SRC[[[RFC 5646]] 4.5.]]。
= [239] [[拡張]]は、 [[singleton]] の大文字・小文字を区別しない [[ASCII]] 順にします。
= [240] [[祖父化]]または[[冗長]]として登録されている[[言語タグ]]であって、
[[Preferred-Value]] が示されていれば、その[[言語タグ]]に置き換えます。
= [241] 各[[部分タグ]]が登録されていて [[Preferred-Value]] が示されていれば、
その[[部分タグ]]に置き換えます。

;; [243] これは [[RFC 4646]] 4.4. に示されていた[[正準化]]の方法とは少し違っています。
両者は実質的に等価だと思いますが、検証していません。

[EG[
[246] [CODE(lang)[[[en-BU]]]] (英語、ビルマ) の[[正準形]]は [CODE(lang)[[[en-MM]]]]
(英語、ミャンマー) です。
]EG]

[EG[
[247] [CODE(lang)[[[en-b-ccc-bbb-a-aaa-X-xyz]]]] は[[正準形]]ではありませんが、
[CODE(lang)[[[en-a-aaa-b-ccc-bbb-x-xyz]]]] は[[正準形]]です。
]EG]

;; [249] ここでいう[[正準化]]には[[大文字・小文字]]の正規化は含まれていません。
また用字形抑制や[[異体]]の順序など、[[言語タグ]]の仕様上[['''推奨''']]されている要件であっても、
[[正準化]]によって満たされないものがあります。

;; [250] [[拡張]]は、それぞれの[[正準形]]をそれぞれにおいて規定できるとされています。

** 拡張言語形

[242] [[整形式]][[言語タグ]]は次の手順で[DFN[[RUBYB[拡張言語形]@en[extlang form]]]]に変形できます。
[SRC[[[RFC 5646]] 4.5.]]
= [244] [[正準形]]にします。
= [245] [[拡張言語]]でもある[[言語]]ではじまるなら、その[[拡張言語]]の [[Prefix]] を先頭に挿入します。

[248] [[正準形]]では必ず[[拡張言語]]が含まれない形になるので、[[言語]]と[[拡張言語]]の両方を含めた形の方が便利なときには[[拡張言語形]]が良いとされています。

** その他

[288] [[言語タグ]]は冗長性や廃止された値が多くあるので、それらの扱いについて個別に規定している仕様もあります。

[287] [[ヘブライ語]]を表すいろいろな[[言語タグ]]、 [CODE(lang)[[[iw]]]] や [CODE(lang)[[[iw-IL]]]] や 
[CODE(lang)[[[he-IL]]]] や [CODE(lang)[[[he]]]] を等価として扱わなければならないとする仕様もあります。
([CODE(lang)[[[he]]]] の項を参照。)

* 言語タグの適合性

[176] [[言語タグ]]の[[適合性]]については、[[整形式]]と[[妥当]]の2つの基準が設けられています。

** 整形式言語タグ

[177] [[言語タグ]]は [[ABNF]] 構文に一致する時、[RUBY[[[整形式]]][せいけいしき]@en[well-formed]]です。
[SRC[[[RFC 5646]] 2.2.9.]]

** 妥当な言語タグ

[178] [[言語タグ]]は、
- [179] [[整形式]]であり、
- [180] [[異体]][[部分タグ]]に重複がなく、
- [181] [[拡張]][[部分タグ]]の [[singleton]] に重複がなく、
- [182] [[タグ]]全体が[[祖父化]]タグのいずれかであるか、またはタグを構成する[[言語]]、[[拡張言語]]、[[用字系]]、[[地域]]、[[異体]]の[[部分タグ]]がすべて [[IANA]] に登録されたものであれば、

... [RUBYB[[[妥当]]]@en[valid]]です。
[SRC[[[RFC 5646]] 2.2.9.]]

** 歴史

[184] [[RFC 5646]] は[[言語タグ]]の[[適合性]]を定義していますが、 [[RFC 4646]]
はそれを処理する[[実装]]の[[適合性]]を定義していました。実装は >>185 と >>186
のいずれかを明示的に引用して適合性を主張する[['''べきだ''']]とされていました
[SRC[[[RFC 4646]] 2.2.9.]]。

[185] [[RFC 4646]] における[[整形式]]性を検証する実装は、 >>177 に加えて、 >>181
もチェックしなければなりませんでした。
[SRC[[[RFC 4646]] 2.2.9.]]

[186] [[RFC 4646]] における[[妥当]]性を検証する実装は、 >>178 に加えて、
対応している[[拡張]]について[[妥当]]性をチェックすることが求められていました。
[[異体]]と[[拡張言語]]について、登録簿上の [[Prefix]] の要件を満たしているかチェックすることも求められていました。
更に、対応している[[登録簿]]や[[拡張]]の版・日付について指定することが求められていました。
[SRC[[[RFC 4646]] 2.2.9.]]

** メモ

[187] [[RFC 4646]] についても [[RFC 5646]] についても、[[妥当]]であるからといって [[RFC]]
上のすべての要件を満たしていることにはなりません。

* 言語タグの集合

[276] [[言語タグ]]と[[ワイルドカード]]によって[[言語タグ]]の[[集合]]を表現する「[[言語範囲]]」
や[[言語範囲]]を複数列挙した「[[言語優先度リスト]]」が
[[HTTP]] の [CODE(HTTP)@en[[[Accept-Language:]]]] などで用いられています。

* 歴史

[REFS[
- [83] [CITE@en[Object Header lines in HTTP]] <http://www.w3.org/Protocols/HTTP/Object_Headers.html#z9>
]REFS]

[37] 非常に古い [[HTTP]] では、 RFC 1766 の [CODE(ABNF)["-"]] を使う方法ではなく [[POSIX]] の [[locale]] 名のように [CODE(ABNF)["_"]] で区切っていました。 

[38] >>37 現在でも間違ってこちらが使われる可能性がありますから、実装は両方に対応しているといいかもしれません。

[39] [[HTML]] 3.0 では [[lang]] 属性の値に [CODE(ABNF)["-"]] の代わりに [CODE(ABNF)["."]] を使っていました。 (''The Body Element and Related Elements'' <http://www.w3.org/MarkUp/html3/docbody.html#Body>)

** RFC 1766

[REFS[
- [266] [CITE@en[RFC 1766 - Tags for the Identification of Languages]] 
<http://tools.ietf.org/html/rfc1766>
]REFS]

;; [4] [[RFC 1766]] の項も参照してください。

[267] [[IETF]] で初めて[[言語タグ]]を規定した正式な仕様書が [[RFC 1766]]
です。 [[RFC 1766]] は[[標準化過程]] [[RFC]] で、[[提案標準]]でした。

[290] [[IETF]] における[[国際化]]について議論している [[RFC 2130]] と [[RFC 2277]]
では、[[言語タグ]]を [[IETF]] での標準的な言語識別方法としています。

[FIG[
[286] 
>   The term 'language tag' should be reserved for the short identifier
of RFC 1766 [RFC-1766] that only serves to identify the language.
While there may be other text attributes intimately associated with
the language of the document, such as desired font or text direction,
these should be specified with other identifiers rather than
overloading the language tag.

[FIGCAPTION[
[285] [CITE@en[RFC 2130 - The Report of the IAB Character Set Workshop held 29 February - 1 March, 1996]] ([TIME[2011-09-04 12:12:00 +09:00]] 版) <http://tools.ietf.org/html/rfc2130#page-8>
]FIGCAPTION]
]FIG]

[REFS[
- [6] [CITE@en[[[RFC 2277]] - IETF Policy on Character Sets and Languages]] 
<http://tools.ietf.org/html/rfc2277#section-4.3>
]REFS]

- [291] [[プロトコル]]は [[RFC 1766]] [[言語タグ]]を使う[['''べきです''']]。 [SRC[>>6 4.3.]]
- [292] 明確かつ正当な事由がある場合はこの限りではありません。 [SRC[>>6 4.3.]]

** HTTP/1.1

[257] [[HTTP/1.1]] ([[RFC 2068]], [[RFC 2616]]) は、[[RFC 1766]]
を引用しつつも独自に[[言語タグ]]の構文を規定しています。

[92] 
[FIG[
[FIGCAPTION[
RFC 2068・2616 (HTTP/1.1) 3.10 Language Tags
]FIGCAPTION]

> A language tag identifies a natural language spoken, written, or
otherwise conveyed by human beings for communication of information
to other human beings. Computer languages are explicitly excluded.
HTTP uses language tags within the Accept-Language and Content-Language fields.

[DFN[言語札識別子]]は、人間が他の人間と情報の通信をするために話したり書いたりその他伝達する自然言語を識別します。
計算機言語は陽に除外します。 HTTP
は [CODE(HTTP)[[[Accept-Language]]]] 欄と [CODE(HTTP)[[[Content-Language]]]]
欄の中で言語札を使います。

> The syntax and registry of HTTP language tags is the same as that
defined by RFC 1766 [1]. In summary, a language tag is composed of 1
or more parts: A primary language tag and a possibly empty series of subtags:

HTTP 言語札の構文と登録簿は [[RFC1766]] で定義されているものと同じです。
要約すると、言語札は一つ以上の部分の組合せ、すなわち
主言語札と空かもしれない部分札の系列です。

>
- language-tag  = primary-tag *( "-" subtag )
- primary-tag   = 1*8ALPHA
- [DEL[[INS[{2068,2616}]] subtag        = 1*8ALPHA]]
- [INS[[INS[{Errata}]] subtag        = 1*8(ALPHA / DIGIT)]]

> White[INS[ ]]space is not allowed within the tag and all tags are case-insensitive. The name space of language tags is administered by the
IANA. Example tags include:

[[空白]]は札の中では認められず、すべての札は大文字・小文字を区別しません。
言語札の名前空間は [[IANA]] で管理します。札の例:

> en, en-US, en-cockney, i-cherokee, x-pig-latin

> where any two-letter primary-tag is an ISO[INS[-]]639 language abbreviation
and any two-letter initial subtag is an ISO[INS[-]]3166 country code. (The
last three tags above are not registered tags; all but the last are
examples of tags which could be registered in future.)

ここで、2文字の主札は [[ISO639]] の言語の略語で、
2文字の最初の部分札は [[ISO3166]] 国名符号です。
(上の最後の3つの札は登録されていない札です。最後のもの以外は将来登録されるかもしれない例です。)

* RFC の部分のライセンス

[[RFCのライセンス]]
]FIG]

[258] 元々の定義は [[RFC 1766]] に基づく、[[数字]]が認められていないものでした。
[[正誤表]]により [[RFC 3066]] に基づく[[数字]]が使える定義に改められています。

** RFC 3066

[1] 言語札は [[RFC 1766]] が定義していましたが、 [[RFC 3066]] に改訂されました。

[REFS[
- [259] [CITE@en[RFC 3066 - Tags for the Identification of Languages]] 
<http://tools.ietf.org/html/rfc3066>
]REFS]

;; [5] [[RFC 3066]] の項も参照してください。

[78] [[RFC 1766]] は[[標準化過程]] [[RFC]] ([[提案標準]]) でしたが、
[[RFC 3066]] 以後は [[BCP]] ([DFN[[[BCP 47]]]]) となっています。

[REFS[
- [17] ''LANGUAGE TAGS'' <http://www.iana.org/assignments/language-tags> (last updated 2004-06-02)
- [18] ''Directory of language tag applications'' <http://www.iana.org/assignments/lang-tag-apps.htm>
]REFS]

** RFC 4646

[REFS[
- [274] [CITE@en[RFC 4646 - Tags for Identifying Languages]]
<http://tools.ietf.org/html/rfc4646>
]REFS]

;; [77] [[RFC 4646]] の項も参照してください。

[275] [[RFC 3066]] は全面改訂により [[RFC 4646]] に変わっています。 [[RFC 4646]]
は構文についても登録の仕方についても根本的に改めており、
完全には互換性がない新しい仕様となっています。

[REFS[
- [139] [CITE@en[RFC 4645 - Initial Language Subtag Registry]] 
<http://tools.ietf.org/html/rfc4645>
]REFS]

[256] [[RFC 4645]] は、 [[RFC 4646]] の標準化に際して改めて作成された新しい [[IANA]]
登録簿の初期状態の内容 ([DFN[[ABBR[[[ILSR]]][Initial Language Subtag Registry]]]]) 
を用意した方法について説明しています。

[REFS[
- [272] [CITE@en[RFC 4647 - Matching of Language Tags]]
<http://tools.ietf.org/html/rfc4647>
]REFS]

[273] [[RFC 3066]] のうち[[言語範囲]]と一致演算については [[RFC 4647]]
に分離されています。

** RFC 5646

[79] [[RFC 5646]] への改訂では、仕様の全体的な構成と内容は変わっていませんが、
細かな編集上の変更が数多く加わっています。また、前の版で未定義だった[[拡張言語]]が正式に定義されています。

[80] その他、前の版で[[ブラックホール]]になっていた[RUBYB[[[祖父]]]@en[grandfathered]]の [[ABNF]]
定義が改められ、何でも一致する定義から、 [[RFC 3066]] 時代までに登録されて現在の基準には沿わない[[言語タグ]]をすべて列挙する形に改められています。

[81] [[IANA登録簿]]の書式が [[US-ASCII]] から [[UTF-8]] に変更されています。

;; [82] また非互換変更かよ・・・。

[REFS[
[64] [CITE@en[RFC 5646 - Tags for Identifying Languages]]
([TIME[2009-09-09 03:41:39 +09:00]] 版)
<http://tools.ietf.org/html/rfc5646>
]REFS]

[65] [[RFC 4646]] が出てからまだ3年しか経ってないのに改訂とか超うけるwwwwwwwwwwwwwwww

[66] 調べてみたら [[RFC 1766]] → [[RFC 3066]] で5年、 [[RFC 3066]] → [[RFC 4646]]
で5年なのねwwwwwwwww

[70] >>65 逆に、 [[IETF]] でたった3年で改訂版を出せるのが奇跡かもwww

;; [252] というか前回で完成しなかったところを引き続きやってたからか。

[69] [CITE[Diff: rfc4646.txt - rfc5646.txt]] ([TIME[2011-09-04 15:00:06 +09:00]] 版) <http://tools.ietf.org/tools/rfcdiff/rfcdiff.pyht?url1=http://www.ietf.org/rfc/rfc4646.txt&url2=http://www.ietf.org/rfc/rfc5646.txt>

だいぶ変わってるな・・・。

[REFS[
[67] [CITE@en[RFC 5645 - Update to the Language Subtag Registry]]
([TIME[2009-09-09 02:23:51 +09:00]] 版)
<http://tools.ietf.org/html/rfc5645>
]REFS]

[253] [[RFC 5645]] は、 [[RFC 5646]] への改訂に際して行われた大規模な [[IANA]]
登録簿の追加と改訂の内容について説明しています。

* 実装

[280] [[WebHACC]] 付属のツール <http://suika.fam.cx/gate/2007/html/langtag/?tag=en>
で[[言語タグ]]の構文解析結果や適合性エラーを見ることができます。

* テスト・ケース

[62]
[REFS[
[DEL[
- [CITE[Re: '''['''Ltru''']''' Re: Test suite for language tags?]] ([TIME[2006-09-20 01:12:23 +09:00]] 版) <http://www1.ietf.org/mail-archive/web/ltru/current/msg05589.html>
]DEL]
[INS[
- [CITE[Re: '''['''Ltru''']''' Re: Test suite for language tags?]] ([TIME[2008-05-28 18:32:25 +09:00]] 版) <http://www.ietf.org/mail-archive/web/ltru/current/msg05590.html>
]INS]
]REFS]

[REFS[
- [251] [CITE[t/langtag-1.dat at master from wakaba/manakai - GitHub]]
<https://github.com/wakaba/manakai/blob/master/t/langtag-1.dat>
]REFS]

* 関連

** 他の言語符号

[117] [[言語符号]]の仕様としては[[言語タグ]]の他、[[ISO 639]]、[[SIL]] などがあります。

[63] [[OpenDocument]] 1.0 の
[CODE(XMLe)@en[dc:[[language]]]] [[要素]]の[[内容]]は [[RFC 3066]] [[言語札]]に''似たもの''で、
[[ISO 639]] 2文字/3文字[[言語符号]]のあとに省略可能で [CODE[[[-]]]] と
[[ISO 3166]] 2文字[[国名符号]]が来るような値、とされています。

;; 他の[[属性]]は [[RFC 3066]] [[言語札]]を使っているので、
この[[要素]]だけは [[Dublin Core]] の定義に基づいているのでしょうかね。

** 応用

[192] [[HTML]] の [CODE(HTMLa)@en[[[lang]]]] [[属性]]や [[XML]]
の [CODE(XMLa)@en[[[xml:lang]]]] [[属性]]は [[IETF]] の[[言語タグ]]を値に採用しています。
これらの[[属性]]は[[言語情報]]の不在を示すために[[空文字列]]も値として認めています。

[193] [[HTTP]] や [[MIME]] の [CODE(HTTP)@en[[[Content-Language:]]]] [[欄]]や
[CODE(HTTP)@en[[[Accept-Language:]]]] [[欄]]は値として [[IETF]]
の[[言語タグ]]を採用しています。

* 言語タグの一覧

[2]
,名前	,言語	,(札の)典拠	,参考
,[CODE(lang)[[[af]]]]	,Afrikaans	,	,
,[CODE(lang)[[[af-ZA]]]]
,[CODE(lang)[[[afr]]]]]	,Afrikaans	,	,3文字 ->[CODE(lang)[af]]
,[CODE(lang)[[[alb]]]]]	,Albanian	,	,非標準 ->[CODE(lang)[sq]]
,[CODE(lang)[[[am-ET]]]]	,Amharic/Ethiopia
,[CODE(lang)[[[ar]]]]	,Arabic	,	,
,[CODE(lang)[[[ara]]]]	,Arabic	,	,3文字 ->[CODE(lang)[ar]]
,ar-AE	,Arabic/UAE	,[MOZILLA]	,
,ar-BH	,Arabic/Bahrain	,[MOZILLA]	,
,ar-DZ	,Arabic/Algeria	,[MOZILLA]	,
,[CODE(lang)[[[ara-DZ]]]]	,Arabic/Algeria	,	,3文字 ->[CODE(lang)[ar-DZ]]
,ar-EG	,Arabic/Egypt	,[MOZILLA]	,
,[CODE(lang)[[[ara-EG]]]]	,Arabic/Egypt	,	,3文字 ->[CODE(lang)[ar-EG]]
,ar-IQ	,Arabic/Iraq	,[MOZILLA]	,
,[CODE(lang)[[[ara-IQ]]]]	,Arabic/Iraq	,	,3文字 ->[CODE(lang)[ar-IQ]]
,ar-JO	,Arabic/Jordan	,[MOZILLA]	,
,[CODE(lang)[[[ara-JO]]]]]	,Arabic/Jordan	,	,3文字 ->[CODE(lang)[ar-JO]]
,ar-KW	,Arabic/Kuwait	,[MOZILLA]	,
,ar-LB	,Arabic/Lebanon	,[MOZILLA]	,
,ar-LY	,Arabic/Libya	,[MOZILLA]	,
,[CODE(lang)[[[ara-LY]]]]]	,Arabic/Libya	,	,3文字 ->[CODE(lang)[ar-LY]]
,ar-MA	,Arabic/Morocco	,[MOZILLA]	,
,[CODE(lang)[[[ara-MA]]]]]	,Arabic/Morocco	,	,3文字 ->[CODE(lang)[ar-MA]]
,ar-OM	,Arabic/Oman	,[MOZILLA]	,
,[CODE(lang)[[[ar-pal]]]]	,Arabic/Palestina	,	,未登録
,[CODE(lang)[[[ara-pal]]]]	,Arabic/Palestina	,	,3文字 ->[CODE(lang)[ar-pal]]
,ar-QA	,Arabic/Qatar	,[MOZILLA]	,
,[CODE(lang)[[[ar-SA]]]]	,Arabic/Saudi Arabia	,[MOZILLA]	,
,[CODE(lang)[[[ara-SA]]]]	,Arabic/Saudi Arabia	,	,3文字 ->[CODE(lang)[ar-SA]]
,[CODE(lang)[[[ar-SD]]]]	,Arabic/Sudan	,	,
,[CODE(lang)[[[ara-SD]]]]	,Arabic/Sudan	,	,3文字 ->[CODE(lang)[ar-SD]]
,ar-SY	,Arabic/Syria	,[MOZILLA]	,
,[CODE(lang)[[[ara-SY]]]]	,Arabic/Syria	,	,3文字 ->[CODE(lang)[ar-SY]]
,ar-TN	,Arabic/Tunisia	,[MOZILLA]	,
,ar-YE	,Arabic/Yemen	,[MOZILLA]	,
,[CODE(lang)[[[arm]]]]]	,Armenian	,	,非標準 ->[CODE(lang)[hy]]
,[CODE(lang)[[[art-lojban]]]]	,Lojban	,[IANAREG]	,非推奨 ->[CODE(lang)[jbo]]
,[CODE(lang)[[[as]]]]	,Assamese	,	,
,[CODE(lang)[[[ast-ES]]]]	,Asturian
,[CODE(lang)[[[asz-sk-SK]]]]	,Eastern Slovak
,[CODE(lang)[[[az-Arab]]]]	,Azerbaijani (アラビア文字)	,[IANAREG]
,[CODE(lang)[[[az-arabic]]]]	,Azerbaijani (アラビア文字)	,[RFC 1766]	,非推奨 ->[CODE(lang)[az-Arab]]
,[CODE(lang)[[[az-AZ]]]]	,Azerbaijani/Azerbaijan
,[CODE(lang)[[[az-cyr]]]]	,Azerbaijani (キリル文字)	,	,非推奨 ->[CODE(lang)[az-Cyrl]]
,[CODE(lang)[[[aze-cyr]]]]	,Azerbaijani (キリル文字)	,	,3文字 ->[CODE(lang)[az-cyr]]
,[CODE(lang)[[[az-cyrillic]]]]	,Azerbaijani (キリル文字)	,[RFC 1766]	,非推奨 ->[CODE(lang)[az-Cyrl]]
,[CODE(lang)[[[az-Cyrl]]]]	,Azerbaijani (キリル文字)	,[IANAREG]
,[CODE(lang)[[[az-latin]]]]	,Azerbaijani (ラテン文字)	,	,非推奨 ->[CODE(lang)[az-Latn]]
,[CODE(lang)[[[aze-latin]]]]	,Azerbaijani (ラテン文字)	,	,3文字 ->[CODE(lang)[az-latin]]
,[CODE(lang)[[[az-Latn]]]]	,Azerbaijani (ラテン文字)	,[IANAREG]
,[CODE(lang)[[[ba-RU]]]]	,Bashkir
,[CODE(lang)[[[baq]]]]	,Basque	,	,3文字 ->[CODE(lang)[eu]]
,[CODE(lang)[[[be]]]]	,Belarusian	,	,
,[CODE(lang)[[[be-BY]]]]	,Belarusian/Belarusi
,[CODE(lang)[[[bel]]]]	,Belarusian	,	,3文字 ->[CODE(lang)[be]]
,[CODE(lang)[[[ben]]]]	,Bengali	,	,3文字 ->[CODE(lang)[bn]]
,[CODE(lang)[[[bg]]]]	,Bulgarian	,	,
,[CODE(lang)[[[bg-BG]]]]	,Bulgarian/Bulgaria	,	,
,[CODE(lang)[[[bn]]]]	,Bengali	,	,
,[CODE(lang)[[[bn-BD]]]]	,Bengali/Bangladesh
,[CODE(lang)[[[br-FR]]]]	,Breton/France
,[CODE(lang)[[[bs-BA]]]]	,Bosnian/Bosnia
,[CODE(lang)[[[bul]]]]	,Bulgarian	,	,3文字 ->[CODE(lang)[bg]]
,[CODE(lang)[[[ca]]]]	,Catalan	,	,
,[CODE(lang)[[[ca-ES]]]]	,Catalan
,[CODE(lang)[[[cat]]]]	,Catalan	,	,3文字 ->[CODE(lang)[ca]]
,[CODE(lang)[[[ceb]]]]	,Cebuano
,[CODE(lang)[[[ceb-PH]]]]	,Cebuano/Bisaya
,[CODE(lang)[[[cel-gaulish]]]]	,	,[IANAREG]	,
,[CODE(lang)[[[ces]]]]	,Czech	,	,3文字 ->[CODE(lang)[cs]]
,[CODE(lang)[[[chi-amoy]]]]	,中文/Amoy	,	,3文字 ->[CODE(lang)[zh-amoy]]
,[CODE(lang)[[[chi-canton]]]]	,中文/広東語	,	,3文字 ->[CODE(lang)[zh-canton]]
,[CODE(lang)[[[chi-chaozhou]]]]	,中文/ChaoZhou	,	,3文字 ->[CODE(lang)[zh-chaozhou]]
,[CODE(lang)[[[chi-CN-wu]]]]	,中文/中華大陸/Wu	,	,3文字 ->[CODE(lang)[zh-CN-wu]]
,[CODE(lang)[[[chi-fukien]]]]	,中文/福建語	,	,3文字 ->[CODE(lang)[zh-fukien]]
,[CODE(lang)[[[chi-fuzhou]]]]	,中文/Fuzhou	,	,3文字 ->[CODE(lang)[zh-fuzhou]]
,[CODE(lang)[[[chi-hainan]]]]	,中文/Hainan	,	,3文字 ->[CODE(lang)[zh-hainan]]
,[CODE(lang)[[[chi-hakka]]]]	,中文/客家語	,	,3文字 ->[CODE(lang)[zh-hakka]]
,[CODE(lang)[[[chi-mandarin-smpl]]]]	,中文/官話方言 (簡体字)	,	,3文字 ->[CODE(lang)[zh-mandarin-smpl]]
,[CODE(lang)[[[chi-mandarin-trad]]]]	,中文/官話方言 (伝統字)	,	,3文字 ->[CODE(lang)[zh-mandarin-trad]]
,[CODE(lang)[[[chi-yunnan]]]]	,中文/YunNan	,	,3文字 ->[CODE(lang)[zh-yunnan]]
,[CODE(lang)[[[cpf-MU]]]]	,(Creole) Mauritian
,[CODE(lang)[[[cs]]]]	,Czech	,	,
,[CODE(lang)[[[cs-CZ]]]]	,Czech
,[CODE(lang)[[[cze]]]]	,Czech	,	,3文字 ->[CODE(lang)[cs]]
,[CODE(lang)[[[cy-ZV]]]]	,Welsh Cymraeg/Great Britain
,[CODE(lang)[[[da]]]]	,Danish	,	,
,[CODE(lang)[[[dan]]]]	,Danish	,	,3文字 ->[CODE(lang)[da]]
,[CODE(lang)[[[da-DK]]]]	,Danish	,
,[CODE(lang)[[[de]]]]]	,German	,	,
,[CODE(lang)[[[deu]]]]]	,German	,	,3文字 ->[CODE(lang)[de]]
,de-1901	,German (伝統正書法)	,[IANAREG]	,
,de-1996	,German (1996年正書法)	,[IANAREG]	,
,[CODE(lang)[[[de-AT]]]]	,German/Austria	,[MOZILLA]	,
,[CODE(lang)[[[deu-AT]]]]]	,German/Austria	,	,3文字 ->[CODE(lang)[de-AT]]
,de-AT-1901	,German/Austria (伝統正書法)	,[IANAREG]	,
,de-AT-1996	,German/Austria (1996年正書法)	,[IANAREG]	,
,de-CH	,German/Swiss	,[MOZILLA]	,
,[CODE(lang)[[[deu-CH]]]]]	,German/Swiss	,	,3文字 ->[CODE(lang)[de-CH]]
,de-CH-1901	,German/Swiss (伝統正書法)	,[IANAREG]	,
,de-CH-1996	,German/Swiss (1996年正書法)	,[IANAREG]	,
,de-DE	,German/Germany	,[MOZILLA]	,
,de-DE-1901	,German/Germany (伝統正書法)	,[IANAREG]	,
,de-DE-1996	,German/Germany (1996年正書法)	,[IANAREG]	,
,[CODE(lang)[[[de-DE-u-attr-co-phonebk]]]],,[[RFC 6067]] 例示
,de-LI	,独語/Liechtenstein	,[MOZILLA]	,
,[CODE(lang)@en[[[x-default]]]]
,[CODE(lang)[[[deu-LI]]]]]	,German/Liechtenstein	,	,3文字 ->[CODE(lang)[de-LI]]
,de-LU	,独語/Luxembourg	,[MOZILLA]	,
,[CODE(lang)[[[deu-LU]]]]]	,German/Luxembourg	,	,3文字 ->[CODE(lang)[de-LU]]
,[CODE(lang)[[[dut]]]]	,Dutch	,	,3文字 ->[CODE(lang)[nl]]
,[CODE(lang)[[[el]]]]	,Greek	,	,
,[CODE(lang)[[[ell]]]]]	,Greek	,	,3文字 ->[CODE(lang)[el]]
,[CODE(lang)[[[el-GR]]]]	,Greek/Greece	,
,[[english]]	,英語	,	,非標準
,en-AU	,オーストラリア英語	,[MOZILLA]	,
,[CODE(lang)[[[eng-AU]]]]	,English/Australia	,	,3文字 ->[CODE(lang)[en-AU]]
,[CODE(lang)[[[en-boont]]]]	,Boontling	,[IANAREG]
,en-BZ	,英語/Belize	,[MOZILLA]	,
,[CODE(lang)[[[eng-BZ]]]]	,English/Belize	,	,3文字 ->[CODE(lang)[en-BZ]]
,en-CA	,英語/Canada	,[MOZILLA]	,
,[CODE(lang)[[[eng-CA]]]]	,Canadian English	,	,3文字 ->[CODE(lang)[en-CA]]
,[[en-CN]]	,[[チングリッシュ]]	,	,
,en-cockney	,ロンドン英語	,[RFC 1766]	,
,en-GB	,英語/Great Britain	,[MOZILLA]	,
,[CODE(lang)[[[eng-GB]]]]	,English/Great Britain	,	,3文字 ->[CODE(lang)[en-GB]]
,[CODE(lang)@en[[[en-GB-Hixie]]]]	,[[Hixie English]]	,時代遅れ → [CODE(lang)@en[[[en-GB-x-Hixie]]]]
,[CODE(lang)@en[[[en-GB-x-Hixie]]]]	,[[Hixie English]]	,
,[CODE(lang)[[[en-GB-oed]]]]	,English/Oxford English Dictionary 綴り	,[IANAREG]
,en-IE	,英語/Ireland	,[MOZILLA]	,
,[CODE(lang)[[[eng-IE]]]]	,English/Ireland	,	,3文字 ->[CODE(lang)[en-IE]]
,en-JM	,英語/Jamaica	,[MOZILLA]	,
,[CODE(lang)[[[eng-JM]]]]	,English/Jamaica	,	,3文字 ->[CODE(lang)[en-JM]]
,en-JP	,[[ジャパニッシュ]]
,en-NZ	,英語/New Zealand	,[MOZILLA]	,
,[CODE(lang)[[[eng-NZ]]]]	,English/New Zealand	,	,3文字 ->[CODE(lang)[en-NZ]]
,en-PH	,英語/フィリピン	,[MOZILLA]	,
,en-securid
,[CODE(lang)[[[en-scouse]]]]	,英語 Liverpool 方言 (Scouse)	,[IANAREG]	,
,[CODE(lang)[[[en-x-SI]]]]	,English ([[SI]] 単位系)
,[CODE(lang)@en[[[en-SN]]]]	,	,?
,en-TT	,英語/Trinidad	,[MOZILLA]	,
,[CODE(lang)[[[eng-TT]]]]	,English/Trinidad	,	,3文字 ->[CODE(lang)[en-TT]]
,[CODE(lang)[[[en-US]]]]	,American English	,[RFC 3066]
,[CODE(lang)[[[eng-US]]]]	,American English	,	,3文字 ->[CODE(lang)[en-US]]
,[CODE(lang)@en[[[en-US-h3h]]]]	,	,[[IANA]]''未''登録
,[CODE(lang)@en[[[en-US-Hixie]]]]	,	,[[IANA]]''未''登録
,en-US-slang	,米俗語	,[QUIALANG] (>>21)
,en-ZA	,英語/南アフリカ	,[MOZILLA]	,
,[CODE(lang)[[[eng-ZA]]]]	,English/South Africa	,	,3文字 ->[CODE(lang)[en-ZA]]
,[CODE(lang)[[[est]]]]	,Estonian	,	,3文字 ->[CODE(lang)[et]]
,en-ZW	,英語/Zimbabwe	,[MOZILLA]	,
,[CODE(lang)[[[english]]]]	,English	,	,非標準 ->[CODE(lang)[en]]
,[CODE(lang)[[[eo]]]]	,Esperanto
,[CODE(lang)[[[es-AR]]]]	,Spanish/Argentina	,[MOZILLA]	,
,[CODE(lang)[[[esl-AR]]]]	,Spanish/Argentina	,	,3文字 ->[CODE(lang)[es-AR]]
,es-BO	,西班牙語/Bolivia	,[MOZILLA]	,
,[CODE(lang)[[[esl-BO]]]]	,Spanish/Bolivia	,	,3文字 ->[CODE(lang)[es-BO]]
,es-CL	,西班牙語/Chile	,[MOZILLA]	,
,[CODE(lang)[[[esl-CL]]]]	,Spanish/Chile	,	,3文字 ->[CODE(lang)[es-CL]]
,[CODE(lang)[[[es-CO]]]]	,Spanish/Colombia	,[MOZILLA]	,
,[CODE(lang)[[[esl-CO]]]]	,Spanish/Colombia	,	,3文字 ->[CODE(lang)[es-CO]]
,es-CR	,西班牙語/Costa Rica	,[MOZILLA]	,
,[CODE(lang)[[[esl-CR]]]]	,Spanish/Costa Rica	,	,3文字 ->[CODE(lang)[es-CR]]
,es-DO	,西班牙語/ドミニカ共和国	,[MOZILLA]	,
,[CODE(lang)[[[esl-DO]]]]	,Spanish/Dominican Republic	,	,3文字 ->[CODE(lang)[es-DO]]
,es-EC	,西班牙語/Ecuador	,[MOZILLA]	,
,[CODE(lang)[[[esl-EC]]]]	,Spanish/Ecuador	,	,3文字 ->[CODE(lang)[es-EC]]
,[CODE(lang)[[[es-ES]]]]	,Spanish/Spain	,[MOZILLA]	,
,es-GT	,西班牙語/Guatemala	,[MOZILLA]	,
,[CODE(lang)[[[esl-GT]]]]	,Spanish/Guatemala	,	,3文字 ->[CODE(lang)[es-GT]]
,[CODE(lang)[[[es-HN]]]]	,Spanish/Honduras	,[MOZILLA]	,
,[CODE(lang)[[[esl-HN]]]]	,Spanish/Honduras	,	,3文字 ->[CODE(lang)[es-HN]]
,es-MX	,西班牙語/Mexico	,[MOZILLA]	,
,[CODE(lang)[[[esl-MX]]]]	,Spanish/Mexico	,	,3文字 ->[CODE(lang)[es-MX]]
,[CODE(lang)[[[es-modern]]]]	,Spanish (現代語)	,	,未登録
,[CODE(lang)[[[esl-modern]]]]	,Spanish (現代語)	,	,3文字 ->[CODE(lang)[es-modern]]
,es-NI	,西班牙語/Nicaragua	,[MOZILLA]	,
,[CODE(lang)[[[esl-NI]]]]	,Spanish/Nicaragua	,	,3文字 ->[CODE(lang)[es-NI]]
,es-PA	,西班牙語/Panama	,[MOZILLA]	,
,[CODE(lang)[[[esl-PA]]]]	,Spanish/Panama	,	,3文字 ->[CODE(lang)[es-PA]]
,es-PE	,西班牙語/Peru	,[MOZILLA]
,[CODE(lang)[[[esl-PE]]]]	,Spanish/Peru	,	,3文字 ->[CODE(lang)[es-PE]]
,es-PR	,西班牙語/Puerto Rico	,[MOZILLA]	,
,[CODE(lang)[[[esl-PR]]]]	,Spanish/Puerto Rico	,	,3文字 ->[CODE(lang)[es-PR]]
,es-PY	,西班牙語/Parguay	,[MOZILLA]	,
,[CODE(lang)[[[esl-PY]]]]	,Spanish/Parguay	,	,3文字 ->[CODE(lang)[es-PY]]
,es-SV	,西班牙語/El Salvador	,[MOZILLA]	,
,[CODE(lang)[[[esl-SV]]]]	,Spanish/El Salvador	,	,3文字 ->[CODE(lang)[es-SV]]
,[CODE(lang)[[[es-trad]]]]	,Spanish (伝統語)	,	,未登録
,[CODE(lang)[[[esl-trad]]]]	,Spanish (伝統語)	,	,3文字 ->[CODE(lang)[es-trad]]
,es-US	,西班牙語/合衆国	,[MSIE]	,
,es-UY	,西班牙語/Uruguay	,[MOZILLA]	,
,[CODE(lang)[[[esl-UY]]]]	,Spanish/Uruguay	,	,3文字 ->[CODE(lang)[es-UY]]
,es-VE	,西班牙語/Venezuela	,[MOZILLA]	,
,[CODE(lang)[[[esl-VE]]]]	,Spanish/Venezuela	,	,3文字 ->[CODE(lang)[es-VE]]
,[CODE(lang)[[[et]]]]	,Estonian	,	,
,[CODE(lang)[[[et-EE]]]]	,Estonian/Estonia
,[CODE(lang)[[[eu]]]]	,Basque	,	,
,[CODE(lang)[[[eu-ES]]]]	,Basque
,[CODE(lang)[[[eus]]]]]	,Basque	,	,3文字 ->[CODE(lang)[eu]]
,[CODE(lang)[[[fa]]]]	,Farsi	,	,
,[CODE(lang)[[[fa-AF]]]]	,Farsi/Afghan	,	,
,[CODE(lang)[[[fas-AF]]]]]	,Farsi/Afghan	,	,3文字 ->[CODE(lang)[fa-AF]]
,[CODE(lang)[[[fa-IR]]]]	,Persian/Iran	,	,
,[CODE(lang)[[[fas-IR]]]]]	,Farsi/Iran	,	,3文字 ->[CODE(lang)[fa-IR]]
,[CODE(lang)[[[fao]]]]	,Faeroese	,	,
,[CODE(lang)[[[fi]]]]	,Finnish	,	,
,[CODE(lang)[[[fin]]]]	,Finnish	,	,3文字 ->[CODE(lang)[fi]]
,[CODE(lang)[[[fi-FI]]]]	,Finish/Finland
,[CODE(lang)[[[fr]]]]	,French	,	,
,[CODE(lang)[[[fra]]]]	,French	,	,3文字 ->[CODE(lang)[fr]]
,[CODE(lang)[[[fre]]]]	,French	,	,3文字 ->[CODE(lang)[fr]]
,fr-BE	,仏語/Belgium	,[MOZILLA]	,
,[CODE(lang)[[[fra-BE]]]]	,French/Belgium	,	,3文字 ->[CODE(lang)[fr-BE]]
,[CODE(lang)[[[fre-BE]]]]	,French/Belgium	,	,3文字 ->[CODE(lang)[fr-BE]]
,fr-CA	,仏語/Canada	,[MOZILLA]	,
,[CODE(lang)[[[fra-CA]]]]	,French/Canada	,	,3文字 ->[CODE(lang)[fr-CA]]
,[CODE(lang)[[[fre-CA]]]]	,French/Canada	,	,3文字 ->[CODE(lang)[fr-CA]]
,fr-CH	,仏語/スイス	,[MOZILLA]	,
,[CODE(lang)[[[fra-CH]]]]	,French/Swiss	,	,3文字 ->[CODE(lang)[fr-CH]]
,[CODE(lang)[[[fre-CH]]]]	,French/Swiss	,	,3文字 ->[CODE(lang)[fr-CH]]
,[CODE(lang)[[[fr-FR]]]]	,French/France	,[MOZILLA]	,
,fr-LU	,仏語/ルクセンブルク	,[MOZILLA]	,
,[CODE(lang)@en[[[fr-JP-antipop]]]]	,	,[[IANA]] ''未''登録
,[CODE(lang)[[[fra-LU]]]]	,French/Luxembourg	,	,3文字 ->[CODE(lang)[fr-LU]]
,[CODE(lang)[[[fre-LU]]]]	,French/Luxembourg	,	,3文字 ->[CODE(lang)[fr-LU]]
,fr-MC	,仏語/モナコ	,[MOZILLA]	,
,[CODE(lang)[[[ga-IE]]]]	,Irish Gaelic	,
,[CODE(lang)[[[gd]]]]	,Gaelic	,	,
,[CODE(lang)[[[gd-GB]]]]	,Scots Gaelic
,[CODE(lang)[[[geo]]]]]	,Georgian	,	,3文字 ->[CODE(lang)[ka]]
,[CODE(lang)[[[ger]]]]]	,German	,	,3文字 ->[CODE(lang)[de]]
,[[german]]	,独語	,	,非標準
,[CODE(lang)[[[ger-AT]]]]]	,German/Austria	,	,3文字 ->[CODE(lang)[de-AT]]
,[CODE(lang)[[[ger-CH]]]]]	,German/Swiss	,	,3文字 ->[CODE(lang)[de-CH]]
,[CODE(lang)[[[ger-LI]]]]]	,German/Liechtenstein	,	,3文字 ->[CODE(lang)[de-LI]]
,[CODE(lang)[[[ger-LU]]]]]	,German/Luxembourg	,	,3文字 ->[CODE(lang)[de-LU]]
,[CODE(lang)[[[gl-ES]]]]	,Galician
,[CODE(lang)[[[gre]]]]]	,Greek	,	,3文字 ->[CODE(lang)[el]]
,[CODE(lang)[[[gu]]]]	,Gujarati	,	,
,[CODE(lang)[[[ha]]]]	,Hausa	,	,
,[CODE(lang)[[[hau]]]]]	,Hausa	,	,3文字 ->[CODE(lang)[ha]]
,[CODE(lang)[[[he]]]]	,Hebrew	,	,
,[CODE(lang)[[[heb]]]]]	,Hebrew	,	,3文字 ->[CODE(lang)[he]]
,[CODE(lang)[[[he-IL]]]]	,Hebrew/Israel
,[CODE(lang)[[[hi]]]]	,Hindi	,	,
,[CODE(lang)[[[hi-IN]]]]	,Hindi/India
,[CODE(lang)[[[hil-PH]]]]	,Hiligaynon/Ilonngo
,[CODE(lang)[[[hin]]]]]	,Hindi	,	,3文字 ->[CODE(lang)[hi]]
,[CODE(lang)[[[hu]]]]	,Hungarian	,	,
,[CODE(lang)[[[hun]]]]]	,Hungarian	,	,3文字 ->[CODE(lang)[hu]]
,[CODE(lang)[[[hu-HU]]]]	,Hungarian/Hungary	,	,
,[CODE(lang)[[[hr]]]]	,Croatian	,	,
,[CODE(lang)[[[hr-HR]]]]	,Croatian	,
,[CODE(lang)[[[hsb-DE]]]]	,Upper Sorbian
,[CODE(lang)[[[hy]]]]	,Armenian	,	,
,[CODE(lang)[[[hye]]]]]	,Armenian	,	,3文字 ->[CODE(lang)[hy]]
,i-ami	,	,[IANAREG]	,
,i-bnn	,	,[IANAREG]	,
,i-cherokee	,	,[RFC 1766]	,
,i-enochian	,	,[IANAREG]	,
,i-default	,''既定言語''	,[[RFC 2277]>>10647] [IANAREG]
,i-hak	,客家語	,[IANAREG]	,非推奨 ([CODE(LANG)[zh-hakka]])
,i-lux	,Luxembourgish	,[IANAREG]	,非推奨 ->[CODE(LANG)[lb]]
,i-mingo	,Mingo	,[IANAREG]	,
,i-pwn	,Paiwan	,[IANAREG]	,
,i-sami-no	,北セミ語	,[RFC 1766]	,
,i-tao	,Tao	,[IANAREG]	,
,i-tay	,Tayal	,[IANAREG]	,
,i-tsolyani	,	,[[RFC3066]>>20]
,i-tsu	,Tsuo	,[IANAREG]	,
,[CODE(lang)[[[ice]]]]]	,Icelandic	,	,3文字 ->[CODE(lang)[is]]
,[CODE(lang)[[[id]]]]	,Indonesian	,	,
,[CODE(lang)[[[id-ID]]]]	,Indonesian/Indonesia
,[[ie-ee]]
,[CODE(lang)[[[ilo]]]]	,Iloko	,	,
,[CODE(lang)[[[ind]]]]]	,Indonesian	,	,3文字 ->[CODE(lang)[id]]
,[CODE(lang)[[[is]]]]	,Icelandic	,	,
,[CODE(lang)[[[isl]]]]]	,Icelandic	,	,3文字 ->[CODE(lang)[is]]
,[CODE(lang)[[[is-IS]]]]	,Icelandic/Iceland
,[CODE(lang)[[[it]]]]	,Italian	,	,
,[CODE(lang)[[[ita]]]]]	,Italian	,	,3文字 ->[CODE(lang)[it]]
,it-CH	,伊語/Switzerland	,[MOZILLA]	,
,[CODE(lang)[[[it-CH]]]]]	,Italian/Swiss	,	,3文字 ->[CODE(lang)[it-CH]]
,[CODE(lang)[[[it-IT]]]]	,Italian/Italy	,
,ja-2ch	,日本語/にちゃんねる語
,ja-classic	,日本語/古語
,ja-classic-heian	,日本語/古語/平安時代
,[CODE(lang)[[[ja-JP]]]]	,日本語/日本国	,	,[[RFC 2482]]
,[CODE(lang)@en[[[ja-JPM]]]]	,[[日本語]]/[[日本国]]/[[Mac OS]]	,"非標準, [[IANA]]''未''登録, 廃止 →[CODE(lang)@en[[[ja-JP-mac]]]]"	,[[Mozilla]]
,[CODE(lang)@en[[[ja-JP-mac]]]]	,[[日本語]]/[[日本国]]/[[Mac OS]]	,[[IANA]]''未''登録	,[[Mozilla]]
,[[japanese]]	,日本語	,	,非標準 ->[CODE(lang)[ja]]
,ja-ryuukyuu	,琉球語
,[CODE(lang)[[[jbo]]]]	,Lojban	,[ISO 639-2] 2003-09-02
,jp	,日本語	,[WinIE 1〜3]	,非標準 ->[CODE(lang)[ja]]
,[CODE(lang)[[[jpn]]]]]	,日本語	,	,3文字 ->[CODE(lang)[ja]]
,[CODE(lang)[[[ka]]]]	,Georgian	,	,
,[CODE(lang)[[[ka-GE]]]]	,Georgian
,[CODE(lang)[[[kac]]]]	,Kachin	,	,
,[CODE(lang)[[[kan]]]]	,Kannada	,	,
,[CODE(lang)[[[kas]]]]	,Kashimiri	,	,
,[CODE(lang)[[[kat]]]]]	,Georgian	,	,3文字 ->[CODE(lang)[ka]]
,[CODE(lang)[[[kaz]]]]]	,Kazakh	,	,3文字 ->[CODE(lang)[kk]]
,[CODE(lang)[[[kir]]]]]	,Kirghiz	,	,3文字 ->[CODE(lang)[ky]]
,[CODE(lang)[[[kk]]]]	,Kazakh	,	,
,[CODE(lang)[[[i-klingon]]]]	,Klingon	,[IANAREG]	,非推奨 ->[CODE(lang)[tlh]]
,[CODE(lang)[[[x-klingon]]]]	,Klingon	,	,非推奨 ->[CODE(lang)[tlh]]
,[CODE(lang)@en[[[i-klingon-romanized]]]],[[Klingon]]/[[ラテン文字]],非標準
,[CODE(lang)[[[kn-IN]]]]	,Kannada
,[CODE(lang)[[[ko]]]]	,Korean	,	,
,[CODE(lang)[[[kor]]]]]	,Korean	,	,3文字 ->[CODE(lang)[ko]]
,[CODE(lang)[[[ko-KP]]]]	,朝鮮語/朝鮮民主主義人民共和国	,[MOZILLA]	,
,[CODE(lang)[[[ko-KR]]]]	,韓語/大韓民国	,[MOZILLA]	,
,[CODE(lang)[[[kok]]]]	,Konkani	,	,
,[CODE(lang)[[[kon]]]]
,[CODE(lang)[[[kr]]]]	,Korean	,"[Apache] (修正済み), W3C 文書 (修正済み)"	,非標準 ->[CODE(lang)[ko]]
,[CODE(lang)[[[ky]]]]	,Kirghiz	,	,
,[CODE(lang)[[[kw-GB]]]]	,Cornish/Great Britain
,[CODE(lang)[[[lav]]]]]	,Latvian	,	,3文字 ->[CODE(lang)[lv]]
,[CODE(lang)[[[lb]]]]	,Luxembourgish	,[ISO 639] 1998-09-09
,[CODE(lang)[[[lb-LU]]]]	,L&#235;tzeburgesch/L&#235;tzeburg
,[CODE(lang)[[[lin]]]]]	,Lingala	,	,3文字 ->[CODE(lang)[ln]]
,[CODE(lang)[[[lit]]]]]	,Lithuanian	,	,3文字 ->[CODE(lang)[lt]]
,[CODE(lang)[[[lit-classic]]]]]	,Lithuanian 古語	,	,"未登録, 3文字 ->[CODE(lang)[lt-classic]]"
,[CODE(lang)[[[ln]]]]	,Lingala	,	,
,[CODE(lang)[[[lo-LA]]]]	,Lao/Lao
,[CODE(lang)[[[lt]]]]	,Lithuanian	,	,
,[CODE(lang)[[[lt-classic]]]]	,Lithuanian 古語	,	,未登録
,[CODE(lang)[[[lt-LT]]]]	,Lithuanian/Lithuania
,[CODE(lang)[[[lv]]]]	,Latvian	,	,
,[CODE(lang)[[[lv-LV]]]]	,Latvian/Latvia
,[CODE(lang)[[[mac]]]]]	,Macedonian	,	,3文字 ->[CODE(lang)[mk]]
,[CODE(lang)[[[mar]]]]	,Marathi	,	,
,[CODE(lang)[[[may]]]]]	,Malaysian	,	,3文字 ->[CODE(lang)[ms]]
,[CODE(lang)[[[mg]]]]	,Malagasy	,	,
,[CODE(lang)[[[mi-NZ]]]]	,Maori/New Zealand
,[CODE(lang)[[[x-minbari-warrior-caste]]]]	,Minbari (warrior caste)
,[CODE(lang)[[[mk]]]]	,Macedonian	,	,
,[CODE(lang)[[[mke]]]]]	,Macedonian	,	,3文字 ->[CODE(lang)[mk]]
,[CODE(lang)[[[mk-MK]]]]	,Macedonian/Macedonia	,[MOZILLA]	,
,[CODE(lang)[[[ml]]]]	,Malayalam	,	,
,[CODE(lang)[[[mlg]]]]]	,Malagasy	,	,3文字 ->[CODE(lang)[mg]]
,[CODE(lang)[[[mn]]]]	,Mongolian	,	,
,[CODE(lang)[[[mn-MN]]]]	,Mongolian/Mongolia
,[CODE(lang)[[[mni]]]]	,Manipuri	,	,
,[CODE(lang)[[[mo]]]]	,Molodavian	,	,
,[CODE(lang)[[[mol]]]]]	,Molodavian	,	,3文字 ->[CODE(lang)[mo]]
,[CODE(lang)[[[mo-MD]]]]	,Moldavian/Moldavia
,[CODE(lang)[[[mon]]]]]	,Mongolian	,	,3文字 ->[CODE(lang)[mn]]
,[CODE(lang)[[[ms]]]]	,Malaysian	,	,
,[CODE(lang)[[[ms-MY]]]]	,Malay Bahasa Melayu
,[CODE(lang)[[[msa]]]]]	,Malaysian	,	,3文字 ->[CODE(lang)[ms]]
,[CODE(lang)@en[[[mul]]]]	,複数言語	,[[ISO]][[国際規格]]	,[[ISO 639]]
,[CODE(lang)@en[[[mul-kambun]]]]	,[[漢文]]
,[CODE(lang)[[[i-navajo]]]]	,Navajo	,[IANAREG]	,非推奨 ->[CODE(LANG)[nv]]
,[CODE(lang)[[[nb]]]]	,Norwegian Bokm&#229;l	,[ISO 639] 2000-02-18
,[CODE(lang)[[[nb-NO]]]]	,Norwegian Bokm&#229;l/Norway	,[MSIE]	,
,[CODE(lang)[[[nds]]]]	,Low Saxon
,[CODE(lang)[[[ne]]]]	,Nepali	,	,
,[CODE(lang)[[[nep]]]]]	,Nepali	,	,3文字 ->[CODE(lang)[ne]]
,[CODE(lang)@mul[[x-Nise-Chinese]]]]	,偽中国語
,[CODE(lang)[[[nl]]]]	,Dutch	,	,
,[CODE(lang)[[[nld]]]]	,Dutch	,	,3文字 ->[CODE(lang)[nl]]
,[CODE(lang)[[[nl-BE]]]]	,オランダ語/ベルギー	,[MOZILLA]	,
,[CODE(lang)[[[nl-NL]]]]	,Dutch	,
,[CODE(lang)[[[nn]]]]	,New Norwegian	,[ISO 639] 2000-02-18
,[CODE(lang)[[[nn-NO]]]]	,Norwegian Nynorsk	,[MSIE]	,
,[CODE(lang)[[[no-bok]]]]	,Norwegian/Book Language	,[IANAREG]	,非推奨 ->[CODE(LANG)[nb]]
,[CODE(lang)[[[no-nyn]]]]	,New Norwegian	,[IANAREG]	,非推奨 ->[CODE(LANG)[nn]]
,no-nynorsk	,新諾威語	,[RFC 1766]	,非推奨 ->[CODE(LANG)[nn]]
,[CODE(lang)[[[x-none]]]]	,なし	,	,非標準 ->[CODE(lang)[[[und]]]]
,[CODE(lang)[[[nso-ZA]]]]	,Sotho Northern
,[CODE(lang)[[[nv]]]]	,Navajo	,[ISO 639] 2000-02-18
,[CODE(lang)[[[or]]]]	,Oriya	,	,
,[CODE(lang)[[[pa]]]]	,Punjabi	,	,
,[CODE(lang)[[[pan]]]]	,Panjabi	,	,
,[CODE(lang)[[[pa-US]]]]	,Punjabi/United States of America
,[CODE(lang)[[[pdf]]]]
,[CODE(lang)[[[per-AF]]]]]	,Farsi/Afghan	,	,3文字 ->[CODE(lang)[fa-AF]]
,[CODE(lang)[[[per-IR]]]]]	,Farsi/Iran	,	,3文字 ->[CODE(lang)[fa-IR]]
,[CODE(lang)[[[pl]]]]	,Polish	,	,
,[CODE(lang)[[[pl-PL]]]]	,Polish
,[CODE(lang)[[[pol]]]]]	,Polish	,	,3文字 ->[CODE(lang)[pl]]
,[CODE(lang)[[[por]]]]]	,Portuguese	,	,3文字 ->[CODE(lang)[pt]]
,[CODE(lang)[[[por-BR]]]]]	,Portuguese/Brazil	,	,3文字 ->[CODE(lang)[pt-BR]]
,[CODE(lang)[[[ps]]]]	,Pushto	,	,
,[CODE(lang)[[[pt]]]]	,Portuguese	,	,
,[CODE(lang)[[[pt-BR]]]]	,Portuguese/Brazil	,[MOZILLA]
,[CODE(lang)[[[pt-PT]]]]	,Portuguese/Portugal	,
,[CODE(lang)[[[pus]]]]]	,Pushto	,	,3文字 ->[CODE(lang)[ps]]
,ro-MD	,ルーマニア語/モルドバ	,[MSIE]	,
,ro-MO	,ルーマニア語/モルドバ	,
,[CODE(lang)[[[ro-RO]]]]/Romanian/Romania
,[CODE(ABNF)['rs' [[DIGIT]] '_' 11[[HEXDIGIT]]]]	,何かのプログラムのバグ?	,	,非標準
,[CODE(lang)[[[ru]]]]	,Русский язык	,	,
,ru-MD	,露西亜語/モルドバ	,[MSIE]	,
,ru-MO	,露西亜語/モルドバ	,
,[CODE(lang)[[[ru-RU]]]]	,Русский язык/Руссия	,
,[CODE(lang)[[[rum]]]]	,Romanian	,	,
,[CODE(lang)[[[run]]]]	,Rundi	,	,
,[CODE(lang)[[[rus]]]]]	,Русский язык	,	,3文字 ->[CODE(lang)[ru]]
,[CODE(lang)[[[ron]]]]]	,Romanian	,	,
,[CODE(lang)[[[sa]]]]	,Sanscrit	,	,
,[CODE(lang)[[[sc-GB]]]]	,Scots/Great Britain
,[CODE(lang)[[[sd]]]]	,Sindhi	,	,
,[CODE(lang)[[[sd-PK]]]]	,Sindhi
,sgn-BE-fr	,	,[IANAREG]	,
,sgn-BE-nl	,	,[IANAREG]	,
,sgn-BR	,	,[IANAREG]	,
,sgn-CH-de	,	,[IANAREG]	,
,sgn-CO	,	,[IANAREG]	,
,sgn-DE	,	,[IANAREG]	,
,sgn-DK	,	,[IANAREG]	,
,sgn-ES	,	,[IANAREG]	,
,sgn-FR	,	,[IANAREG]	,
,sgn-GB	,	,[IANAREG]	,
,sgn-GR	,	,[IANAREG]	,
,sgn-IE	,	,[IANAREG]	,
,sgn-IT	,	,[IANAREG]	,
,sgn-JP	,	,[IANAREG]	,
,sgn-MX	,	,[IANAREG]	,
,[CODE(lang)[[[sgn-NI]]]]	,手話/Nicaraguan	,[IANAREG]
,sgn-NL	,	,[IANAREG]	,
,sgn-NO	,	,[IANAREG]	,
,sgn-PT	,	,[IANAREG]	,
,sgn-SE	,	,[IANAREG]	,
,sgn-US	,	,[IANAREG]	,
,sgn-US-MA	,マーサズ[RUBY[葡萄園] [ヴィンヤード]]島の手話	,[[RFC 3066]>>19]
,sgn-ZA	,	,[IANAREG]	,
,[CODE(lang)[[[si]]]]	,Shinhalese	,	,
,[CODE(lang)[[[sin]]]]]	,Shinhalese	,	,3文字 ->[CODE(lang)[si]]
,[CODE(lang)[[[sk]]]]	,Slovak	,	,
,[CODE(lang)[[[sk-SK]]]]	,Slovak/Slovakia
,[CODE(lang)[[[sl]]]]	,Slovenian	,	,
,[CODE(lang)[[[sl-nedis]]]]	,Slovenian/Nadiza 方言	,[IANAREG]
,[CODE(lang)[[[sl-rozaj]]]]	,Rezijan	,[IANAREG]
,[CODE(lang)[[[sl-SI]]]]	,Slovenian/Slovenia
,[CODE(lang)[[[slk]]]]]	,Slovak	,	,3文字 ->[CODE(lang)[sk]]
,[CODE(lang)[[[slo]]]]]	,Slovak	,	,3文字 ->[CODE(lang)[sk]]
,[CODE(lang)[[[slv]]]]]	,Slovenian	,	,3文字 ->[CODE(lang)[sl]]
,[CODE(lang)[[[sn]]]]	,Shona	,	,
,[CODE(lang)[[[sna]]]]]	,Shona	,	,3文字 ->[CODE(lang)[sn]]
,[CODE(lang)[[[so]]]]	,Somali	,	,
,[CODE(lang)[[[som]]]]]	,Somali	,	,3文字 ->[CODE(lang)[so]]
,[CODE(lang)[[[sot]]]]	,Sotho	,	,
,[CODE(lang)[[[spa-AR]]]]	,Spanish/Argentina	,	,3文字 ->[CODE(lang)[es-AR]]
,[CODE(lang)[[[spa-BO]]]]	,Spanish/Bolivia	,	,3文字 ->[CODE(lang)[es-BO]]
,[CODE(lang)[[[spa-CL]]]]	,Spanish/Chile	,	,3文字 ->[CODE(lang)[es-CL]]
,[CODE(lang)[[[spa-CO]]]]	,Spanish/Colombia	,	,3文字 ->[CODE(lang)[es-CO]]
,[CODE(lang)[[[spa-CR]]]]	,Spanish/Costa Rica	,	,3文字 ->[CODE(lang)[es-CR]]
,[CODE(lang)[[[spa-DO]]]]	,Spanish/Dominican Republic	,	,3文字 ->[CODE(lang)[es-DO]]
,[CODE(lang)[[[spa-EC]]]]	,Spanish/Ecuador	,	,3文字 ->[CODE(lang)[es-EC]]
,[CODE(lang)[[[spa-GT]]]]	,Spanish/Guatemala	,	,3文字 ->[CODE(lang)[es-GT]]
,[CODE(lang)[[[spa-HN]]]]	,Spanish/Honduras	,	,3文字 ->[CODE(lang)[es-HN]]
,[CODE(lang)[[[spa-MX]]]]	,Spanish/Mexico	,	,3文字 ->[CODE(lang)[es-MX]]
,[CODE(lang)[[[spa-modern]]]]	,Spanish (現代語)	,	,3文字 ->[CODE(lang)[es-modern]]
,[CODE(lang)[[[spa-NI]]]]	,Spanish/Nicaragua	,	,3文字 ->[CODE(lang)[es-NI]]
,[CODE(lang)[[[spa-PA]]]]	,Spanish/Panama	,	,3文字 ->[CODE(lang)[es-PA]]
,[CODE(lang)[[[spa-PE]]]]	,Spanish/Peru	,	,3文字 ->[CODE(lang)[es-PE]]
,[CODE(lang)[[[spa-PR]]]]	,Spanish/Puerto Rico	,	,3文字 ->[CODE(lang)[es-PR]]
,[CODE(lang)[[[spa-PY]]]]	,Spanish/Parguay	,	,3文字 ->[CODE(lang)[es-PY]]	,
,[CODE(lang)[[[spa-SV]]]]	,Spanish/El Salvador	,	,3文字 ->[CODE(lang)[es-SV]]
,[CODE(lang)[[[spa-trad]]]]	,Spanish (伝統語)	,	,3文字 ->[CODE(lang)[es-trad]]
,[CODE(lang)[[[spa-UY]]]]	,Spanish/Uruguay	,	,3文字 ->[CODE(lang)[es-UY]]
,[CODE(lang)[[[spa-VE]]]]	,Spanish/Venezuela	,	,3文字 ->[CODE(lang)[es-VE]]
,[CODE(lang)[[[sq]]]]	,Albanian	,	,
,[CODE(lang)[[[sq-AL]]]]	,Albanian/Albania
,[CODE(lang)[[[sqi]]]]]	,Albanian	,	,3文字 ->[CODE(lang)[sq]]
,[CODE(lang)[[[sr]]]]	,Serbian	,	,
,[CODE(lang)[[[sr-Cyrl]]]]	,Serbian (キリル文字)	,[IANAREG]
,[CODE(lang)[[[sr-latin]]]]	,Serbian (ラテン文字)	,	,非推奨 ->[CODE(lang)[sr-Latn]]
,[CODE(lang)[[[sr-Latn]]]]	,Serbian (ラテン文字)	,[IANAREG]
,[CODE(lang)[[[sr-YU]]]]	,Serbian/Yugoslavia
,[CODE(lang)[[[srd-IT]]]]	,Sardinian Campidanesu
,[CODE(lang)[[[ss-ZA]]]]	,Siswati
,[CODE(lang)[[[sv]]]]	,Swedish	,	,
,[CODE(lang)[[[sve]]]]]	,Swedish	,	,3文字 ->[CODE(lang)[sv]]
,sv-FI	,瑞典語/[RUBY[芬蘭] [フィンランド]]	,[MOZILLA]	,
,[CODE(lang)[[[sve-FI]]]]]	,Swedish/Finland	,	,3文字 ->[CODE(lang)[sv-FI]]
,[CODE(lang)[[[sv-SE]]]]	,Swedish/Sweden	,
,[CODE(lang)[[[sw]]]]	,Swahili	,	,
,[CODE(lang)[[[swa]]]]]	,Swahili	,	,3文字 ->[CODE(lang)[sw]]
,[CODE(lang)[[[sw-TZ]]]]	,Swahili
,[CODE(lang)[[[swe]]]]]	,Swedish	,	,3文字 ->[CODE(lang)[sv]]
,[CODE(lang)[[[swe-FI]]]]]	,Swedish/Finland	,	,3文字 ->[CODE(lang)[sv-FI]]
,[CODE(lang)[[[ta]]]]	,Tamil	,	,
,[CODE(lang)[[[tam]]]]]	,Tamil	,	,3文字 ->[CODE(lang)[ta]]
,[CODE(lang)[[[ta-IN]]]]	,Tamil/India
,[CODE(lang)[[[ta-MY]]]]	,Tamil
,[CODE(lang)[[[te]]]]	,Telugu	,	,
,[CODE(lang)[[[te-IN]]]]	,Telugu/India
,[CODE(lang)[[[teamemh]]]]	,	,	,非標準
,[CODE(lang)[[[tg]]]]	,Tajik	,	,
,[CODE(lang)[[[tgk]]]]]	,Tajik	,	,3文字 ->[CODE(lang)[tg]]
,[CODE(lang)[[[tgl]]]]]	,Tagalog	,	,3文字 ->[CODE(lang)[tl]]
,[CODE(lang)[[[th]]]]	,Thai	,	,
,[CODE(lang)[[[tha]]]]]	,Thai	,	,3文字 ->[CODE(lang)[th]]
,[CODE(lang)[[[th-TH]]]]	,Thai/Thailand	,
,[CODE(lang)[[[tk]]]]	,Turkmen	,	,
,[CODE(lang)[[[tk-TM]]]]	,Turkmen/Turkmenistan
,[CODE(lang)[[[tl]]]]	,Tagalog	,	,
,[CODE(lang)[[[tl-PH]]]]	,Tagalog
,[CODE(lang)[[[tlh]]]]	,Klingon	,[ISO 639-2]
,[CODE(lang)[[[tn-ZA]]]]	,Tswana
,[CODE(lang)[[[tr]]]]	,Turkish	,	,
,[CODE(lang)[[[tr-TR]]]]	,Turkish/Turkey	,
,[CODE(lang)[[[tt]]]]	,Tatar	,	,
,[CODE(lang)[[[tuk]]]]]	,Turkmen	,	,3文字 ->[CODE(lang)[tk]]
,[CODE(lang)[[[tur]]]]]	,Turkish	,	,3文字 ->[CODE(lang)[tr]]
,[CODE(lang)[[[uk]]]]	,Ukrainian	,	,
,[CODE(lang)[[[ukr]]]]]	,Ukrainian	,	,3文字 ->[CODE(lang)[uk]]
,[CODE(lang)[[[uk-UA]]]]	,Ukrainan/Ukraine
,[CODE(lang)[[[unknown]]]]	,未知	,	,非標準 ->[CODE(lang)[[[und]]]]
,[CODE(lang)[[[ur]]]]	,Urdu	,	,
,[CODE(lang)[[[ur-PK]]]]	,Urudu
,[CODE(lang)[[[uz-cyr]]]]	,Uzbek (キリル文字)	,	,非推奨 ->[CODE(lang)[uz-Cyrl]]
,[CODE(lang)[[[uzb-cyr]]]]]	,Uzbek (キリル文字)	,	,3文字 ->[CODE(lang)[uz-cyr]]
,[CODE(lang)[[[uz-Cyrl]]]]	,Uzbek (キリル文字)	,[IANAREG]
,[CODE(lang)[[[uz-latin]]]]	,Uzbek (ラテン文字)	,	,非推奨 ->[CODE(lang)[uz-Latn]]
,[CODE(lang)[[[uzb-latin]]]]]	,Uzbek (ラテン文字)	,	,3文字 ->[CODE(lang)[uz-latin]]
,[CODE(lang)[[[uz-Latn]]]]	,Uzbek (ラテン文字)	,[IANAREG]
,[CODE(lang)[[[val-ca-ES]]]]	,Valencian
,[CODE(lang)[[[ven-ZA]]]]	,Venda
,[CODE(lang)[[[vi]]]]	,Vietnamese	,	,
,[CODE(lang)[[[vie]]]]]	,Vietnamese	,	,3文字 ->[CODE(lang)[vi]]
,[CODE(lang)[[[vi-hanoi]]]]	,Vietnamese/Hanoi	,	,
,[CODE(lang)[[[vie-hanoi]]]]]	,Vietnamese/Hanoi	,	,3文字 ->[CODE(lang)[vi-hanoi]]
,[CODE(lang)[[[vi-saigon]]]]	,Vietnamese/Hanoi	,	,
,[CODE(lang)[[[vie-saigon]]]]]	,Vietnamese/Hanoi	,	,3文字 ->[CODE(lang)[vi-saigon]]
,[CODE(lang)[[[vi-VN]]]]	,Vietnamese/Vietnam	,
,[CODE(lang)[[[war-PH]]]]	,Waray
,x-ainu	,[[アイヌ語]]
,x-pig-latin	,	,[[RFC 2616]]	,
,x-klingon	,クリンゴン語	,[RFC 1766]	,非推奨 ([CODE(LANG)[i-klingon]])
,[CODE(lang)[[[xh]]]]	,Xhosa	,	,
,[CODE(lang)[[[xho]]]]]	,Xhosa	,	,3文字 ->[CODE(lang)[xh]]
,[CODE(lang)[[[xh-ZA]]]]	,Xhosa
,[CODE(lang)[[[yi-Latn]]]]	,Yi (ラテン文字)	,[IANAREG]
,[CODE(lang)[[[yo]]]]	,Yoruba	,	,
,[CODE(lang)[[[yor]]]]]	,Yoruba	,	,3文字 ->[CODE(lang)[yor]]
,[CODE(lang)[[[zh-amoy]]]]	,中文/Amoy	,	,未登録
,[CODE(lang)[[[zho-amoy]]]]	,中文/Amoy	,	,3文字 ->[CODE(lang)[zh-amoy]]
,[CODE(lang)[[[zh-canton]]]]	,中文/広東語	,	,未登録
,[CODE(lang)[[[zho-canton]]]]	,中文/広東語	,	,3文字 ->[CODE(lang)[zh-canton]]
,[CODE(lang)[[[zh-chaozhou]]]]	,中文/ChaoZhou	,	,未登録
,[CODE(lang)[[[zho-chaozhou]]]]	,中文/ChaoZhou	,	,3文字 ->[CODE(lang)[zh-chaozhou]]
,zh-CN	,中文/中華大陸	,[MOZILLA]	,
,[CODE(lang)[[[zh-CN-wu]]]]	,中文/中華大陸/Wu	,	,未登録
,[CODE(lang)[[[zho-CN-wu]]]]	,中文/中華大陸/Wu	,	,3文字 ->[CODE(lang)[zh-CN-wu]]
,[CODE(lang)[[[zh-fukien]]]]	,中文/Fukien	,	,未登録
,[CODE(lang)[[[zho-fukien]]]]	,中文/Fukien	,	,3文字 ->[CODE(lang)[zh-fukien]]
,[CODE(lang)[[[zh-fuzhou]]]]	,中文/Fuzhou	,	,未登録
,[CODE(lang)[[[zho-fuzhou]]]]	,中文/Fuzhou	,	,3文字 ->[CODE(lang)[zh-fuzhou]]
,[CODE(lang)[[[zh-gan]]]]	,Gan	,[IANAREG]	,
,[CODE(lang)[[[zh-guoyu]]]]	,官話	,[IANAREG]	,
,[CODE(lang)[[[zh-hainan]]]]	,中文/Hainan	,	,未登録
,[CODE(lang)[[[zho-hainan]]]]	,中文/Hainan	,	,3文字 ->[CODE(lang)[zh-hainan]]
,[CODE(lang)[[[zh-hakka]]]]	,中文/[[客家語]]	,[IANAREG] 2000-01-10	,
,[CODE(lang)[[[zho-hakka]]]]	,中文/客家語	,	,3文字 ->[CODE(lang)[zh-hakka]]
,[CODE(lang)[[[zh-Hans]]]]	,中文 (簡体字)	,[IANAREG]
,[CODE(lang)[[[zh-Hant]]]]	,中文 (伝統字)	,[IANAREG]
,zh-HK	,中文/[[香港]]	,[MOZILLA]	,
,zh-mandarin	,[[中文]][[官話方言]]	,[639FAQ] (>>3)
,[CODE(lang)[[[zh-mandarin-smpl]]]]	,中文/官話方言 (簡体字)	,	,未登録
,[CODE(lang)[[[zho-mandarin-smpl]]]]	,中文/官話方言 (簡体字)	,	,3文字 ->[CODE(lang)[zh-mandarin-smpl]]
,[CODE(lang)[[[zh-mandarin-trad]]]]	,中文/官話方言 (伝統字)	,	,未登録
,[CODE(lang)[[[zho-mandarin-trad]]]]	,中文/官話方言 (伝統字)	,	,3文字 ->[CODE(lang)[zh-mandarin-trad]]
,[CODE(lang)[[[zh-min]]]]	,"Min, Fuzhou, Hokkien, Amoy, Taiwanese"	,[IANAREG]	,
,[CODE(lang)[[[zh-min-nan]]]]	,"Minnan, Hokkien, Amoy, Taiwanese, Southern Minm Southern Fujian, Hoklo, Southern Fukien, Ho-lo"	,[IANAREG]	,
,zh-MO	,中文/[RUBY[澳門] [マカオ]]	,[MSIE]	,
,zh-SG	,中文/[RUBY[新加坡] [シンガポール]]	,[MOZILLA]	,
,zh-TW	,中文/台湾	,[MOZILLA]	,
,[CODE(lang)[[[zh-wuu]]]]	,"上海語, Wu	"	,[IANAREG]	,
,[CODE(lang)[[[zh-xiang]]]]	,"Xiang, Hunanese	"	,[IANAREG]	,
,[CODE(lang)[[[zh-yue]]]]	,広東語	,[IANAREG]	,
,[CODE(lang)[[[zh-yunnan]]]]	,中文/YunNan	,	,未登録
,[CODE(lang)[[[zho-yunnan]]]]	,中文/YunNan	,	,3文字 ->[CODE(lang)[zh-yunnan]]
,[CODE(lang)[[[zu]]]]	,Zulu	,	,
,[CODE(lang)[[[zul]]]]]	,Zulu	,	,3文字 ->[CODE(lang)[zu]]
,[CODE(lang)[[[zu-ZA]]]]	,Zulu
,[[英語-(U.S)]]	,英語/亜米利加合衆国	,	,非標準 ->[CODE(lang)[en-US]]
,[[日本語]]	,日本語	,	,非標準 ->[CODE(lang)[ja]]

[[#form:'%text(lavel=>札,id=>tag); %text(label=>言語名,id=>langname); %text(id=>src,label=>典拠,size=>10); %text(id=>comment,size=>10,id=>備考); %submit(label=>追加);':',%text(source=>tag);	,%text(source=>langname);	,"%text(source=>src);	","%text(source=>comment);"']]

[22] RFC 3066 によれば、第2小札以降は文法規則 (特に、字数制限: 3〜8文字に注意)
に従う限り自由に使っていいことになっています。このため言語札の一意性は保障されないでしょう。
もっとも言語はそう簡単に増えたり減ったりするものではないですから、滅多なことでは衝突しないでしょうが・・・。
- [44] しかし衝突はしなくても、同じ言語/方言を表す名前が複数存在してしまうことになりかねません。
- [45] 言語札のレベルでは解決できない問題として、言語/方言の区分の方法による非一意性もあります。 >>25 の大阪弁/関西弁問題や、台湾の外省人の言語が北京語と同じなのか (違うかな。) とか。
- [46] >>45 でも中国で北京語といったら北京方言のことで、官話方言のことじゃないそうですね。日本語共通語と山手方言とか江戸っ子言葉の関係みたいなもん?
- [48] 手元の [[WinIE]] 1.0〜3 は [CODE(lang)[[[jp]]]] という間違った値を送ります。

** ja-*

[23] 日本語の方言にも星の数ほど種類がありますから、全部 ja-[VAR[foo]]
にすると大変なことになります。

一つの提案として、[[日本国]]内の地域を主要な使用域とする方言は 
ja-JP-[VAR[大地域名]]-[VAR[*]] とし、[VAR[大地域名]]としては地域名
([CODE[kansai]] など), 現行の47[[都道府県]]名, [[明治時代]]の旧[[国名]]くらいに制限し、それ以上の細かいものは地域的あるいは言語的に近いものの小分類としてはどうでしょう。

[24] ただ、[[大阪弁]]を [CODE(LANG)[ja-JP-oosaka]] にするのか
[CODE(LANG)[ja-JP-kansai-oosaka]] にするのかみたいな話になりますが。
- [25] >>24 大阪弁は有名だから関西弁とは独立させてもいいかも・・。
だけど結局線引き問題は一杯出てきそう。
- [26] >>24 [CODE[oosaka]] より [CODE[osaka]] がイイとか言う意見もありそう。
- [27] [CODE[ja-Kana]] (片仮名) って嫌な名前だなぁ。 ISO 15924 の馬鹿野郎〜
- [28] >>27 こういうのもあると、「小学3年生に習う漢字まで」みたいなのも欲しい気がするが・・・。
- [29] >>28 そういうのを見ると、やぱーり用字系は別指定にしる! とか言いたい気がするが。。。 (この文は [CODE(LANG)[ja-2ch]] に札付けするのが(・∀・)イイ!!)
- [31] >>27-29 といふことで[[用字系札]]に分離しませう。 (この文は [CODE(LANG)[ja-desumasu]]+[CODE(SCRIPT)[Japn-ja-old-kana]] にして下さると嬉しう存じます。)
- [32] >>23-26 ラテン文字3〜4文字の[[都道府県名符号]]を使うのが良い。
- [33] [CODE(LANG)[ja-JP-TKY-shibuya-slang]] 渋谷の女子高生の言葉
- [34] >>33 特に時代を指定したければ [CODE(LANG)[ja-JP-TKY-shibuya-slang-2002]] とするとか。
- [36] <http://pc3.2ch.net/test/read.cgi/hp/1031743538/133-136>
- [41] [CODE(lang)[ja-trad]]: <http://www1.odn.ne.jp/bungaku-shitsu/appendix/diary/d0107-3.html#d010725-8>: 正字正假名の日本語。
- [42] >>41 の使い方は言語と用字系の独立性を欠いてるからお勧めしがたいけど、手軽なのはいいことだ。
- [43] >>34 の書き方を使えば、2ch 閉鎖騒動の頃の言葉遣いを [CODE(lang)[ja-2ch-2001-08]] とか表せて(・∀・)イイ!

** その他の値

- [40] [[XSL-FO]] では言語タグの登場場面である xml:[[lang]]
属性の値に [CODE(XSL)[inherit]] が指定できます。
([[XML]] 的にそんなのありかよ? と思いますが) この値は
[CODE(XML)[xml:lang]] 属性の既定値を明示した形になります。
(''Formatting Properties'' <http://www.w3.org/TR/xsl/slice7.html#xml:lang>)

- [47] 一部の [[DOM]] HTML 実装は、 [CODE(DOMa)[[[lang]]]] 属性の値で、 HTML の [CODE(HTML)[[[lang]]]] 属性に値が明示されていない時には [CODE(lang)[unknown]] を返すらしいです。

* メモ

- [MOZILLA] [[Mozilla]] の実装
- [MSIE] [[M$IE]] の実装
- [21] [QUIALANG] ''lang 属性について [QUIA]'' <http://www5d.biglobe.ne.jp/~quia/tech/html/lang.html>
- [49] [WEAK[2003-09-21 05:31:40 +00:00]] ''[[名無しさん]]'': ''スラッシュドット ジャパン | 国コードや言語コードなどに課金?'' <http://slashdot.jp/article.pl?sid=03/09/20/1440224&mode=flat&commentsort=4&threshold=-1>

- [14] ''ISO 639 Joint Advisory Committee'' <http://lcweb.loc.gov/standards/iso639-2/iso639jac.html>
-- [3] [639FAQ] ''ISO 639 Frequently Asked Questions (FAQ) '' <http://lcweb.loc.gov/standards/iso639-2/faq.html>
- [15] ''ISO 639-1 Registration Authority'' <http://linux.infoterm.org/infoterm-e/raiso639-1_start.htm>
- [16] ''ISO 639-2 Registration Authority - Library of Congress'' <http://www.loc.gov/standards/iso639-2/iso639-2ra.html>

[50]
[CITE[Published subjects for languages in ISO 639]] <http://psi.oasis-open.org/iso/639/>

言語符号の [[URI参照]]。 [[ISO 639]] の3文字符号が使われてます。

[[IETF]] はこれを見習ってとっとと言語札の URI 参照表現を定義してください[AA(face)[:)]]
([[名無しさん]] [WEAK[2005-01-10 00:06:08 +00:00]])

[51]
[CITE[ちょっとしたメモ - 地理コードのURI]] <http://www.kanzaki.com/memo/2005/01/09-1>
([[名無しさん]])

[52]
1月11日付で、[Q@en[No linguistic content]]を表す[CODE(lang block)@en[[[zxx]]]]が追加されました。
[Q@en[Used to declare the absence of linguistic information]]。

;; 
[CITE@en[ISO 639-2/RA Change Notice - Codes for the representation of names of languages (Library of Congress)]] 
<http://www.loc.gov/standards/iso639-2/codechanges.html#20060119>

([[名無しさん]] [WEAK[2006-02-07 03:54:43 +00:00]])

[54]
[CITE[I'm not a Klingon : Change in .Net Framework Culture Names for Windows Vista]] <http://blogs.msdn.com/shawnste/archive/2006/06/02/615674.aspx>
([[名無しさん]] [WEAK[2006-11-08 13:18:26 +00:00]])

[61]
[CITE[Language Tags and Locale Identifiers for the World Wide Web]] ([CODE[2006-12-19 13:39:55 +09:00]] 版) <http://www.w3.org/International/core/langtags/>

[209] [[RFC 4646]]/[[RFC 5646]]、同じ要件が何度も微妙に違う表現で繰り返されたりしていて、
とても読みにくくて悪い仕様書だなあ。

[210] [[IANA]] 登録簿や [[ISO]] の仕様に依存しているせいで仕様書本体の規定に抽象的なものが多くて理解しづらいし。

[223] 例示なのに[[助動詞]]が使われていたりおかしいし。

[227] あとは同じものについての話題があちこちの章にばらばらに出てくるからでしょうなー。
今の章構成もそれなりに意味があるのだろうけど、もっとテーマごとにまとめてコンパクトにできるような。

[293] [CITE@EN[W3C XML Schema Definition Language (XSD) 1.1 Part 2: Datatypes]]
( ([TIME[2012-04-05 06:34:51 +09:00]] 版))
<http://www.w3.org/TR/2012/REC-xmlschema11-2-20120405/#language>

[294] [CITE[Packaged Web Apps (Widgets) - Packaging and XML Configuration (Second Edition)]]
( ([TIME[2012-11-22 21:22:20 +09:00]] 版))
<http://w3c.github.com/packed-webapps/packaging/#rule-for-deriving-the-user-agent-locales>

[295] [CITE@en[Re: Language ranges with more than two sub-tag]]
( ([[Norbert Lindenberg]] 著, [TIME[2013-03-05 15:42:00 +09:00]] 版))
<http://lists.w3.org/Archives/Public/www-international/2013JanMar/0327.html>

[301] [CITE[mattcg/language-tags]]
( ([TIME[2014-03-08 09:10:16 +09:00]] 版))
<https://github.com/mattcg/language-tags>

[302] [CITE[mattcg/language-subtag-registry]]
( ([TIME[2014-03-08 09:10:23 +09:00]] 版))
<https://github.com/mattcg/language-subtag-registry>

[303] [CITE@en-us[Metadata API for Media Resources 1.0]]
( ([TIME[2014-03-12 15:50:19 +09:00]] 版))
<http://www.w3.org/TR/mediaont-api-1.0/#widl-MediaAnnotation-language>