[6] [DFN[[RUBY[文字][もじ]@en[character]]]]は、[[言語]]の表記に用いる[[記号]]の類の[[単位]]であっておおよそ最小単位と考えられるもの、 あるいはそれを[[符号化]]したもの、あるいはその[[符号化]]したものを表現することを主な目的とした[[ビット組合せ]]のことをいいます。 [7] 極めて基本的な用語であるにも関わらず、あるいは基本的な用語であるからこそ、 「[[文字]]」には様々な定義が存在し、曖昧に使われています。 * 色々な意味 [1] [[RFC 3536]] は「[DFN[[RUBYB[文字]@en[character]]]]」は少なくても3通りの意味で使われていて、 最初の2つであることが多いと述べています。 > - [2] a general description of a text entity - [3] a unit of a writing system, often synonymous with "letter" or similar terms - [4] the encoded entity itself [5] [[RFC 3536]] 自体では ([[IETF]] では) [[ISO/IEC 10646]] でいう「[[文字]]」の定義が採用されています。 ここでいうと >>2 でしょうか。 >>4 は[[符号化文字]]でしょうかね。 [8] [CITE@en[Web Applications 1.0 r6648 Try to tidy up some more of the Unicode/code unit mess with a probably over-reaching definition (there's over 2000 uses of the word 'character' in the text, so I didn't check that all of them use this new definition... hopefully it works out; otherwise, we'll just have to try something else again).]] ( ([TIME[2011-10-07 08:24:00 +09:00]] 版))