*符号化文字集合において [10] > :文字 (character): [[データ]]の[[構成]]、[[制御]]又は[[表現]]に用いる[[構成単位]]の[[集合]]の[[要素]]。 [SRC[[[JIS X 0202]]:1998 4.3, [[JIS X 0201]]:1997 3.15]] [7] > :文字 (character): データの構成、制御又は表現に用いる要素の集合の構成単位。 ([[JIS X 0221]]‐1:2001 4.6) [8] > JIS X 0221 で規定される[[制御機能]]の多くのものの定義では、その制御機能が動作する要素を識別するために、 「文字」という語が現れる。そのような制御機能が、 この規格群に従った[[符号化文字]]に適用される場合、 それらの制御機能の動作は、その制御機能が動作する対象の要素 (又は文字) であるとして応用が選択したこの規格群の要素の種類に依ることになろう。 これらの要素は、文字 ([[基底文字]], [[結合文字]]又は両方) として選ばれてよく、適切であれば他の方法によって (例えば、[[合成列]]として) 選ばれてもよい。 (JIS X 0221‐1:2001 15. UCS での制御機能の使用 備考) [9] >文字のもつ意味は、この規格群では規定しない。 これは、[[国]]によって異なったり、 [[適用業務]]によって異なったりする。 (JIS X 0221‐1:2001 17. より) - [1] この定義も SGML の定義も、わかりやすくいってしまえば[[テクストは文字の集合]]ということですわな。別に[[坂村健]]が新しいことを言ったわけじゃないってことですかな。 - [4] [WEAK[2003-09-18 08:13:08 +00:00]] ''[[M]]'': [[#comment]] **文字及び文字集合の種類 -[[固定符号化文字]] -符号化[[図形文字集合]] -符号化[[制御機能]]集合 -符号化単独追加制御機能 ([[JISX0202]]:1998 6.1より) **SGML での定義 [3] >[[文字レパートリ]]で定義されて個々に意味をもつ情報の[RUBYB[原子] [atom]]。 備考1. [[図形文字]]及び[[制御文字]]の2種類がある。 2. 文字は、文脈上に出現し、[[マーク]]又は[[データ内容記法]]によって定義され、文字レパートリの中でその意味を変更又は補足する。 ([[JISX4151]]‐1992 (274)) - [5] [CODE(ABNF)[[DFN[文字]] := [[SGML文字]] / [[NONSGML]] ;; (49)]] [[#comment]] ** HTML での定義 [6] [[情報]]の最小要素、例えば[[字]] ([[letter]]) や[[数字]]。[[図形文字]]は関連付けられた[[グリフ]]を持ち、 [[制御文字]]は関連付けられた処理意味を持つ。 ([[RFC1866]], [[ISO‐HTML]] 4.2 参照。) [[#comment]] * C において [2] > 1[[バイト]]に収まる[[ビット]]表現。 [[ソース環境]]及び[[実行環境]]それぞれの[[基本文字集合]]の各要素の表現は、1バイトに納まらなければならない。 Character。 [INS[([[JISX3010]]-1993)]] [11] > :2.2.2.8 [DFN[文字]] ([DFN@en[character]]): 一つの[[図形文字]]を[[表現]]する一つ以上の[[バイト]]の[[列]]。 -'''参考''' この[[用語]]は、[[プログラム言語]][[C]][[規格]]の[[多バイト文字]]に対応する。 [[単バイト文字]]は、[[多バイト文字]]の特殊な場合とする。 [[プログラム言語]][[C]][[規格]]と異なり、 [[文字]]は、[[記憶域]]と関係をもたない。 この[[規格]]が[[バイト]]という[[用語]]を用いるのは、 [[記憶域]]に関して規定するときに限る。 ;; 出典: [[JIS X 3030]]‐1994 ([[POSIX]]) [[#comment]] *メモ