[128] [DFN[[RUBYB[[[地域]]] @en[[CODE(ABNF)[region]]]]]][[部分タグ]]は、 特定の[[国]]や[[地域]]における[[言語]]のバリエーション ([[方言]]や[[綴り]]の差異など) を表すために使うことあができます。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] ;; [272] [[言語タグ]]全体については、「[[言語タグ]]」の項も参照してください。 * 仕様書 [REFS[ - [273] '''[[RFC 5646]]''' - [276] [CITE@en-us[UTS #35: Unicode Locale Data Markup Language]] ([TIME[2011-07-19 03:14:51 +09:00]] 版) -- [277] -- [278] ]REFS] * 呼称 [274] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では[DFN[[RUBYB[[[領土]]]@en[territory]]]]、 [DFN[[CODE[[[unicode_region_subtag]]]]]] とも呼ばれています [SRC[>>276]]。 * 構文 [129] [[地域]][[部分タグ]]は、[[言語]]、[[拡張言語]]、[[用字系]]の後で、 その他の[[部分タグ]]の前になければ[['''なりません''']] [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]]。 [145] [[地域]][[部分タグ]]は複数個あっては[['''なりません''']]。 他の[[言語]]と区別するような意味を持たない時は省略して[['''構いません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] * 語彙 ** 2文字ラテン文字 [130] 2文字の[[ラテン文字]]の[[地域]][[部分タグ]]は、 [REFS[ - [131] [[ISO 3166-1]] [CITE@en[Codes for the representation of names of countries and their subdivisions -- Part 1: Country codes]] ]REFS] ... で定義された、またはそれにより登録された2文字の[[国符号]]を更に [[IANA]] に登録したものです。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] *** 例外的予約国符号 [279] >>131 で「[RUBYB[例外的の予約]@en[exceptionally reserved]]」された 2文字の[[国符号]]についても、 [[RFC 4646]] には含まれていませんでしたが、 [[RFC 5646]] においては [[IANA]] に登録され、利用できることとされています。 [SRC[[[RFC 5646]] 2.2.4.]] [280] ただし、 [CODE(lang)[[[GB]]]] と同義の [CODE(lang)[[[UK]]]] は除外されています [SRC[[[RFC 5646]] 2.2.4.]]。 *** 私用 [281] [[私用]]の [CODE(lang)[[[AA]]]], [CODE(lang)[[[QM]]]] ... [CODE(lang)[[[QZ]]]], [CODE(lang)[[[XA]]]] ... [CODE(lang)[[[XZ]]]], [CODE(lang)[[[ZZ]]]] も [[IANA]] に登録されており、利用することができます [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]]。 [282] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では、そのうち特に [CODE(lang)[[[XA]]]] .... [CODE(lang)[[[XZ]]]] を[[応用]]が使っても良いと定めています。 [SRC[>>278]] ;; [283] 逆にそれ以外の[[私用]]の[[Unicode領土符号]]は特別な意味を割り当てるために予約されているということです。 **** [CODE(lang)[QO]] [284] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では [DFN[[CODE(lang)[[[QO]]]]]] は [[Outlying Oceania]] を表します [SRC[>>278]]。 **** [CODE(lang)[QU]] [285] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では [DFN[[CODE(lang)[[[QU]]]]]] は[RUBYB[[[欧州連合]]]@en[European Union]]を表します [SRC[>>278]]。 [286] しかし [CODE(lang)[[[EU]]]] を用いるのが[RUBYB[好ましい]@en[preferred]]とされています [SRC[>>278]]。 ;; [287] [CODE(lang)[[[EU]]]] が割り当てられる前にこちらの意味が定義されたようです。 **** [CODE(lang)[ZZ]] [288] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では [DFN[[CODE(lang)[[[ZZ]]]]]] は[RUBYB[未知・非妥当な領土]@en[Unknown or Invalid Territory]]を表します [SRC[>>278]]。 ** 3文字数字 [132] 3文字の[[数字]]の[[地域]][[部分タグ]]は、 [REFS[ - [133] [[UN M.49]] [CITE@en[UN Standard Country or Area Codes for Statistical Use]] ]REFS] ... により定義、または登録されたものを更に [[IANA]] に登録したものです。ただしこれには例外が多くあります。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] [FIG[ - [134] [[大陸]] (macro-geographical (continental)) やその一部の数値符号は登録しなければ[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [135] 経済グループ (economic groupings) やその他のグループ (other groupings) の数値符号は登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [136] [[ISO 3166-1]] が以前別の地域に割り当てていた国符号を別の地域に再割当し、 [[IANA]] 登録簿上で衝突が発生するときには、かわりにこちらの数値符号を登録しなければ[['''なりません''']]。 [SRC[[[RFC 5646]] 2.2.4.]] [WEAK[([[RFC 4646]] 2.2.4. にも類似した規定がありますが、曖昧で意味がよくわかりませんでした。)]] - [137] [[ISO 3166-1]] に対応する[[国符号]]が存在する数値符号は登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] -- [138] これ、 >>136 の場合を除き、ということでいいんですよね・・・。 - [140] [CODE(lang)[[['''830''']]]] ([[チャネル諸島]]) は [[IANA]] に登録してもよいとされています。 [SRC[[[RFC 5646]] 2.2.4.]] -- [141] [[RFC 4646]] 時代には [[RFC 4645]] (>>139) の 4. に示された4つの地域を [[IANA]] に登録しても良いとされていましたが、 [[RFC 4645]] 自体がそのうちの3つは出版の数ヶ月前に [[ISO 3166-1]] 対応する[[国名符号]]が割り当てられているため不適格となった、と述べています。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 4545]] 4.]] -- [142] [[チャネル諸島]]が [[IANA]] に登録されていないのは、 [[ISO 3166-1]] にいずれ登録されることを期待して、ということでしょうか・・・。 - [143] その他の数値符号は [[IANA]] に登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [144] 附属書 X の英数字符号は [[ISO 3166-1]] の[[符号]]と同じものであり、 登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] ]FIG] * 歴史 [262] [[RFC 3066]] では2文字[[国符号]]と、3文字から8文字の[[部分タグ]]が2番目の[[部分タグ]]として認められていました。 3文字から8文字の[[部分タグ]]は [[IANA]] に登録することができるものとされていました。 1文字の[[部分タグ]]は将来の拡張のために予約されていました。 [SRC[[[RFC 3066]] 2.2]] ;; [263] 当時は[[用字形]][[部分タグ]]はなく、また[[私用]]は1番目の[[部分タグ]]に [CODE(lang)[[[x]]]] を使うことによってのみ表せました。 [290] [[RFC 1766]] では2番目以降の[[部分タグ]]として任意の値を登録できるとされていました [SRC[[[RFC 1766]] 2.]]。 [271] [[RFC 1766]] と [[RFC 3066]] は [[ISO 3166]] における[[私用]]の[[国符号]] (>>130) に言及していました [SRC[[[RFC 1766]] 2., [[RFC 3066]] 2.2.]]。 [[RFC 1766]] では単に [[ISO]] で予約されているとしているだけでしたが、 [[RFC 3066]] では使っては[['''ならない''']]とされていました。 [[RFC 4646]] 以降は使って良いとされています。 * 関連 [289] [CITE@en-us[UTS #35: Unicode Locale Data Markup Language]] ([TIME[2011-07-19 03:14:51 +09:00]] 版) では[[私用]]の2文字[[国符号]]、3文字[[国符号]]、3文字数値符号の対応関係が規定されています。