* IANA charset [CODE(MIME)@en[EUC-JP]] [5] [[IANA]]の[[charset]]登録簿には、2006年3月現在 [PRE[ Name: Extended_UNIX_Code_Packed_Format_for_Japanese MIBenum: 18 Source: Standardized by OSF, UNIX International, and UNIX Systems Laboratories Pacific. Uses ISO 2022 rules to select code set 0: US-ASCII (a single 7-bit byte set) code set 1: JIS X0208-1990 (a double 8-bit byte set) restricted to A0-FF in both bytes code set 2: Half Width Katakana (a single 7-bit byte set) requiring SS2 as the character prefix code set 3: JIS X0212-1990 (a double 7-bit byte set) restricted to A0-FF in both bytes requiring SS3 as the character prefix Alias: csEUCPkdFmtJapanese Alias: EUC-JP (preferred MIME name) ]PRE] とあります。 [6] >>5 [CODE(MIME)@en[[[EUC-JP]]]]という名前は後から付け加えられたようです。最初の登録者は一体何を考えていたのでしょうか。 [[#comment]] * 文字符号化[CODE(XML)@en[EUC-JP]] (XML) [4] [[XML 1.0]]および[[XML 1.1]]の仕様書 では、 [[符号化宣言]] ([CODE(XMLa)@en[[[encoding]]]][[擬似属性]]) の値[CODE(XML)@en[[[EUC-JP]]]]は [Q@en['''[[SHOULD]]''' be used for the various encoded forms of JIS X-0208-1997]]とされています。 これをどう解釈するべきかははっきりしません。 [[JIS X 0208]]:1997には[Q[EUC-JP]]とよばれる[[符号化文字集合]]は規定されてい''ない''ようです。 だとすると、一般に[Q[EUC-JP]]と呼ばれている[[符号化文字集合]]の亜種で [[JIS X 0208]]:1997を採用したものと考えるべきでしょうか。 [[#comment]] * メモ -[1] [[Mozilla]] で「©」が含まれた文章を copy & paste で貼り付けてこの [[SuikaWiki]] に送ると、なぜかちゃんと保存・表示されました。 [[WinIE]] で見ても''ちゃんと''文字化けしてるのに。変だなあと思って考えてみると、 SuikaWiki の出力・保存形式は [CODE[EUC-JP]] で、 [CODE[EUC-JP]] の [[G3]] は [[JISX0212]]-1990 で、その JIS X 0212-1990 には [CODE(CHARNAME)[COPYRIGHT SIGN]] が規定されているので、きちんと保存・表示出来て当たり前なのでした。 -[2] >>1 つまり Mozilla はちゃんと EUC-JP に対応しているということです。 WinIE は EUC-JP 対応と見せかけて、実は [[CP20932]] にしか対応していませんね。 - [3] ちなみに [[ClassicMozilla]] も未対応っぽいです。