[128] [DFN[[RUBYB[[[地域]]] @en[[CODE(ABNF)[region]]]]]][[部分タグ]]は、 特定の[[国]]や[[地域]]における[[言語]]のバリエーション ([[方言]]や[[綴り]]の差異など) を表すために使うことあができます。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] ;; [272] [[言語タグ]]全体については、「[[言語タグ]]」の項も参照してください。 * 仕様書 [REFS[ - [273] [[RFC 5646]] ]REFS] * 呼称 [274] [[Unicode言語識別子]]、[[Unicodeロケール識別子]]では[DFN[[RUBYB[[[領土]]]@en[territory]]]]]]とも呼ばれています。 [REFS[ - [275] [CITE@en-us[UTS #35: Unicode Locale Data Markup Language]] ([TIME[2011-07-19 03:14:51 +09:00]] 版) ]REFS] * 構文 [129] [[地域]][[部分タグ]]は、[[言語]]、[[拡張言語]]、[[用字系]]の後で、 その他の[[部分タグ]]の前になければ[['''なりません''']] [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]]。 [145] [[地域]][[部分タグ]]は複数個あっては[['''なりません''']]。 他の[[言語]]と区別するような意味を持たない時は省略して[['''構いません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] * 語彙 [130] 2文字の[[ラテン文字]]の[[地域]][[部分タグ]]は、 [REFS[ - [131] [[ISO 3166-1]] [CITE@en[Codes for the representation of names of countries and their subdivisions -- Part 1: Country codes]] ]REFS] ... で定義された、またはそれにより登録された、 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] あるいは「[RUBYB[例外的の予約]@en[exceptionally reserved]]」された [SRC[[[RFC 5646]] 2.2.4.]] 2文字の[[国符号]]を更に [[IANA]] に登録したものです。 これには[[私用]]の [CODE(lang)[[[AA]]]], [CODE(lang)[[[QM]]]] ... [CODE(lang)[[[QZ]]]], [CODE(lang)[[[XA]]]] ... [CODE(lang)[[[XZ]]]], [CODE(lang)[[[ZZ]]]] を含みます。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] しかし [CODE(lang)[[[GB]]]] と同義の [CODE(lang)[[[UK]]]] [WEAK[(「例外的に予約」)]] は除きます。 [SRC[[[RFC 5646]] 2.2.4.]] [132] 3文字の[[数字]]の[[地域]][[部分タグ]]は、 [REFS[ - [133] [[UN M.49]] [CITE@en[UN Standard Country or Area Codes for Statistical Use]] ]REFS] ... により定義、または登録されたものを更に [[IANA]] に登録したものです。ただしこれには例外が多くあります。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] [FIG[ - [134] [[大陸]] (macro-geographical (continental)) やその一部の数値符号は登録しなければ[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [135] 経済グループ (economic groupings) やその他のグループ (other groupings) の数値符号は登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [136] [[ISO 3166-1]] が以前別の地域に割り当てていた国符号を別の地域に再割当し、 [[IANA]] 登録簿上で衝突が発生するときには、かわりにこちらの数値符号を登録しなければ[['''なりません''']]。 [SRC[[[RFC 5646]] 2.2.4.]] [WEAK[([[RFC 4646]] 2.2.4. にも類似した規定がありますが、曖昧で意味がよくわかりませんでした。)]] - [137] [[ISO 3166-1]] に対応する[[国符号]]が存在する数値符号は登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] -- [138] これ、 >>136 の場合を除き、ということでいいんですよね・・・。 - [140] [CODE(lang)[[['''830''']]]] ([[チャネル諸島]]) は [[IANA]] に登録してもよいとされています。 [SRC[[[RFC 5646]] 2.2.4.]] -- [141] [[RFC 4646]] 時代には [[RFC 4645]] (>>139) の 4. に示された4つの地域を [[IANA]] に登録しても良いとされていましたが、 [[RFC 4645]] 自体がそのうちの3つは出版の数ヶ月前に [[ISO 3166-1]] 対応する[[国名符号]]が割り当てられているため不適格となった、と述べています。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 4545]] 4.]] -- [142] [[チャネル諸島]]が [[IANA]] に登録されていないのは、 [[ISO 3166-1]] にいずれ登録されることを期待して、ということでしょうか・・・。 - [143] その他の数値符号は [[IANA]] に登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] - [144] 附属書 X の英数字符号は [[ISO 3166-1]] の[[符号]]と同じものであり、 登録しては[['''なりません''']]。 [SRC[[[RFC 4646]] 2.2.4., [[RFC 5646]] 2.2.4.]] ]FIG] * 歴史 [262] [[RFC 3066]] では2文字[[国符号]]と、3文字から8文字の[[部分タグ]]が2番目の[[部分タグ]]として認められていました。 3文字から8文字の[[部分タグ]]は [[IANA]] に登録することができるものとされていました。 1文字の[[部分タグ]]は将来の拡張のために予約されていました。 [SRC[[[RFC 3066]] 2.2]] ;; [263] 当時は[[用字形]][[部分タグ]]はなく、また[[私用]]は1番目の[[部分タグ]]に [CODE(lang)[[[x]]]] を使うことによってのみ表せました。 [271] [[RFC 1766]] と [[RFC 3066]] では、[[ISO 3166]] における[[私用]]の[[国符号]] (>>130) は使っては[['''ならない''']] [SRC[[[RFC 1766]] 2., [[RFC 3066]] 2.2.]] とされていました。