* 仕様書 [REFS[ - [1] [CITE@en[RFC 5051 - i;unicode-casemap - Simple Unicode Collation Algorithm]] ([TIME[2014-02-02 02:15:24 +09:00]] 版) ]REFS] * 定義 [2] [CODE@en[[[i;unicode-casemap]]]] は、titlecase 化正準化 UTF-8 について [CODE@en[[[i;octet]]]] と同じように[[等価性]]、[[順序]]、[[部分文字列]]の各演算を定義するものです [SRC[>>1]]。 [3] [DFN[[RUBYB[titlecase 化正準化 UTF-8]@en[titlecased canonicalized UTF-8]]]] とは、 入力が既知の [[charset]] で [[UTF-8]] に変換できるなら [[UTF-8]] に変換した上で次の操作を行い、 そうでないなら元のままとしたものです [SRC[>>1]]。 [[UTF-8]] に変換できた文字列については、 [[UnicodeData.txt]] に基づき次のように処理します。 [FIG[ = [4] [[titlecase]] が定義されていれば、それに置き換える = [5] 分解が定義されていれば、それに置き換える = [6] これらを可能な限り繰り返す ]FIG] * Unicode の版 [8] 特定の [[Unicode]] の版を参照しているのではなく、任意あるいは最新の版を参照しているようです。 * 一覧 [10] 対応関係の一覧は >>9 にあります。 [REFS[ - [9] [CITE@en[Character mapping "rfc5051:titlecase-canonical"]] ([TIME[2014-04-01 12:05:23 +09:00]] 版) ]REFS] * メモ [7] 意図的かどうかは不明ですが、 [[Unicode]] の [[case folding]] や [[NFKC]] の定義を参照せずに、 [[UnicodeData.txt]] の値を直接参照しています。そのため、 [[SpecialCasing.txt]] で定義されるような複雑な[[大文字]]と[[小文字]]の関係は無視されますし、 [[ハングル音節]]の分解は行われません。