#?SuikaWiki/0.9 page-icon="字β" [2] ''[CODE(charset)[UTF-8]] の [[BOM]] は必須ではありません''。 詳しくは [[BOM]>>9] を参照して下さい。 BOM 必須説は、そういうことにしたい人達が勝手に流した風説です。 - [3] [[Unicode]] 3.0 以降では S-area の符号位置 (の UTF-8 表現) は禁止されています。他方、 [CODE[U+FFFF]] のような non-character (の UTF-8 表現) は禁止されていません。 non character は情報交換を目的としたものではありませんから情報交換用で紛れ込んでいたなら間違いですが、内部処理に使うことが出来るものですから、 [[UTF]] で禁止したら使う意味が無くなるということらしいです。 - [6] [WEAK[2003-11-10 23:49:29 +00:00]] ''[[名無しさん]]'': ついに IETF Full Standard の [[RFC3629]] (= [[STD63]]) がでました。 [7] - BEGIN PKCS7----- MIIHoAYJKoZIhvcNAQcEoIIHkTCCB40CAQExggEwMIIBLAIBADCBlDCBjjELMAkG A1UEBhMCVVMxCzAJBgNVBAgTAkNBMRYwFAYDVQQHEw1Nb3VudGFpbiBWaWV3MRQw EgYDVQQKEwtQYXlQYWwgSW5jLjETMBEGA1UECxQKbGl2ZV9jZXJ0czERMA8GA1UE AxQIbGl2ZV9hcGkxHDAaBgkqhkiG9w0BCQEWDXJlQHBheXBhbC5jb20CAQAwDQYJ KoZIhvcNAQEBBQAEgYAe482KzcKxDFNUY9xKdApbjX99O+SbUNMJzfmoSvTDlgc1 dl2rdvttIVQkfF2Ab9634e+s944q1OKN9NJkqcOjg2ieAxmTOcjg8Q9EiADwuIty i9E4TrzviSh2ccWE9omBi0YmDCfmqfBntZVRYJsq9CB09124GFzqagV+rTXmczEL MAkGBSsOAwIaBQAwggEcBgkqhkiG9w0BBwEwFAYIKoZIhvcNAwcECCon5IogftVM gIH4RfebYNXcbhYA2S6LNPvMnYmA3rJdAgu3nwOVeMwooW22Nydo6/Z/I2qXt9d+ 0NaCRelKVB8huk9cuGbQPih5d+J7sEGHWJuDhz/kHICUIpYEhwY+dblA8jiYDhXX dZSoFQCtrOa+QJUArhcq2gYB1QvFEtZgsBlGEAFEhxem4kRo9ITDsgWuEhyax1+k zh4JeJc9Nwp5vw4qmmdXhcBqHUXXfHSlS9GnBE9PIcYs3htvFR2uO6qf+zULEHVw WEe3AltOBa/5CNfBB9YQH5jZPJfqP+M34KHH0IYt6HYsnkPN9veFEKczMKAGCcpu 8K9Ma+s4Lxrskp2gggOHMIIDgzCCAuygAwIBAgIBADANBgkqhkiG9w0BAQUFADCB jjELMAkGA1UEBhMCVVMxCzAJBgNVBAgTAkNBMRYwFAYDVQQHEw1Nb3VudGFpbiBW aWV3MRQwEgYDVQQKEwtQYXlQYWwgSW5jLjETMBEGA1UECxQKbGl2ZV9jZXJ0czER MA8GA1UEAxQIbGl2ZV9hcGkxHDAaBgkqhkiG9w0BCQEWDXJlQHBheXBhbC5jb20w HhcNMDQwMjEzMTAxMzE1WhcNMzUwMjEzMTAxMzE1WjCBjjELMAkGA1UEBhMCVVMx CzAJBgNVBAgTAkNBMRYwFAYDVQQHEw1Nb3VudGFpbiBWaWV3MRQwEgYDVQQKEwtQ YXlQYWwgSW5jLjETMBEGA1UECxQKbGl2ZV9jZXJ0czERMA8GA1UEAxQIbGl2ZV9h cGkxHDAaBgkqhkiG9w0BCQEWDXJlQHBheXBhbC5jb20wgZ8wDQYJKoZIhvcNAQEB BQADgY0AMIGJAoGBAMFHTt38RMxLXJyO2SmS+Ndl72T7oKJ4u4uw+6awntALWh03 PewmIJuzbALScsTS4sZoS1fKciBGoh11gIfHzylvkdNe/hJl66/RGqrj5rFb08sA ABNTzDTiqqNpJeBsYs/c2aiGozptX2RlnBktH+SUNpAajW724Nv2Wvhif6sFAgMB AAGjge4wgeswHQYDVR0OBBYEFJaffLvGbxe9WT9S1wob7BDWZJRrMIG7BgNVHSME gbMwgbCAFJaffLvGbxe9WT9S1wob7BDWZJRroYGUpIGRMIGOMQswCQYDVQQGEwJV UzELMAkGA1UECBMCQ0ExFjAUBgNVBAcTDU1vdW50YWluIFZpZXcxFDASBgNVBAoT C1BheVBhbCBJbmMuMRMwEQYDVQQLFApsaXZlX2NlcnRzMREwDwYDVQQDFAhsaXZl X2FwaTEcMBoGCSqGSIb3DQEJARYNcmVAcGF5cGFsLmNvbYIBADAMBgNVHRMEBTAD AQH/MA0GCSqGSIb3DQEBBQUAA4GBAIFfOlaagFrl71+jq6OKidbWFSE+Q4FqROvd gIONth+8kSK//Y/4ihuE4Ymvzn5ceE3S/iBSQQMjyvb+s2TWbQYDwcp129OPIbD9 epdr4tJOUNiSojw7BHwYRiPh58S1xGlFgHFXwrEBb3dgNbMUa+u4qectsMAXpVHn D9wIyfmHMYIBmjCCAZYCAQEwgZQwgY4xCzAJBgNVBAYTAlVTMQswCQYDVQQIEwJD QTEWMBQGA1UEBxMNTW91bnRhaW4gVmlldzEUMBIGA1UEChMLUGF5UGFsIEluYy4x EzARBgNVBAsUCmxpdmVfY2VydHMxETAPBgNVBAMUCGxpdmVfYXBpMRwwGgYJKoZI hvcNAQkBFg1yZUBwYXlwYWwuY29tAgEAMAkGBSsOAwIaBQCgXTAYBgkqhkiG9w0B CQMxCwYJKoZIhvcNAQcBMBwGCSqGSIb3DQEJBTEPFw0wNDAzMDkyMzQxMjhaMCMG CSqGSIb3DQEJBDEWBBROaqlxk/ADmwyrm0gAjFKsGssvwjANBgkqhkiG9w0BAQEF AASBgHApWaGysF+iOSuVb+dkdxhpByEXKnGRT7yIZxjVdE6g90wEoEb/pJ3qZBFA CoBoga7lgU6DbZft9mvD8eMbpCzxkjaE45uaXZ7b5C+v3sTJtF2Xv/4o+9UzqhLg 4lw3C4ZlYbnmnyDYADPtV4u1jJoGTyP3Fw3rOZYBUNW4tIvk -- END PKCS7----- ([[名無しさん]]) [8] >>7 これ、いったいなんだろう? [WEAK[(PKCS 7? そんなことはわかってますって。)]] 何のつもりでこんなものを貼るのかなあ。 ([[名無しさん]] [WEAK[2004-03-27 02:49:47 +00:00]]) [[#comment]] * Java の UTF [1] [[Java]] が実装している UTF-8 の変種は、 U+0000 を表現するために 0xC0 0x80 を (0x00 の代わりに) 使います。 (0x00 は Java では文字列の終端を表し、文字列内には入れられません。) - [4] このような、「長さが最小ではない表現」は、 UTF-8 では禁止されています。[WEAK[もっとも、各規格は当初そのことを忘れていました。設計者は最初からそのことに注意していたらしいですが、気が抜けていたとかなんとか。]] - [5] 実際には巷の UTF-8 の decoder は最短じゃない表現を「意図どおりに」解読してしまうことがありますが、それは禁止されています。 [9] [Q[Java [RUBYB[修正] [modified]] UTF-8]] (昔は Java の世界で [Q[UTF-8]] と呼ばれていたもの。) は >>1 に加えて [[CESU-8]] らしいです。 ''Supplementary Characters in the Java Platform'' ([[名無しさん]]) [10] ''JNI Types and Data Structures'' ([[名無しさん]]) [[#comment]] * メモ