/[pub]/suikawiki/sw4data/ids/2/1.txt
Suika

Contents of /suikawiki/sw4data/ids/2/1.txt

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.23 - (hide annotations) (download)
Sun Feb 27 14:30:29 2011 UTC (13 years, 9 months ago) by wakaba
Branch: MAIN
Changes since 1.22: +25 -1 lines
File MIME type: text/plain
updated by (anon)

1 wakaba 1.6 [14] [DFN[[CODE(URI)@en[[[http:]]]]]] は、 [[HTTP]] によってアクセスできる[[資源]]を表す
2     [[URL scheme]] です。
3 wakaba 1.2
4 wakaba 1.7 ;; [15] [[Semantic Web]] の世界では、実際には [[HTTP]] でアクセスしても存在していない[[資源]]や、
5 wakaba 1.6 [[HTTP]] によって[[メタデータ]]が取得できるに過ぎない[[資源]]にも [CODE(URI)@en[[[http:]]]] [[URL]]
6     が濫用されています。
7 wakaba 1.2
8 wakaba 1.9 * 仕様書
9    
10     - [18] [CITE@en[RFC 2616 - Hypertext Transfer Protocol -- HTTP/1.1]]
11     <http://tools.ietf.org/html/rfc2616#section-3.2.2>
12    
13 wakaba 1.7 * 意味
14 wakaba 1.2
15 wakaba 1.9 [19] [CODE(HTTP)@en[[[http:]]]] [[URL]] は、指定された [[host]]、[[port]] に [[HTTP]] over [[TCP]]
16     で接続し、 [[path]] と [[query]] を [CODE(ABNF)@en[[[Request-URI]]]] として指定したときに得られる[[資源]]を識別しています。
17     [SRC[>>18, [[RFC 2616]] 正誤表]]
18    
19 wakaba 1.7 ** Semantic Web 界での解釈
20    
21     [5]
22     [CITE[What do HTTP URIs Identify? - Design Issues]] <http://www.w3.org/DesignIssues/HTTP-URI>
23     ([[名無しさん]])
24    
25     [6]
26     [CITE[What do HTTP URIs Identify? - Design Issues]] <http://www.w3.org/DesignIssues/HTTP-URI2.html>
27     ([[名無しさん]])
28 wakaba 1.2
29 wakaba 1.7 [7]
30     [CITE[TAG Issues List]] <http://www.w3.org/2001/tag/issues.html?type=1#httpRange-14>
31     ([[名無しさん]])
32 wakaba 1.2
33 wakaba 1.7 [8]
34     [CITE@EN[URNs, Namespaces and Registries]] ([CODE[2006-09-01 17:51:46 +09:00]] 版) <http://www.w3.org/2001/tag/doc/URNsAndRegistries-50-2006-08-17.html>
35 wakaba 1.2
36 wakaba 1.10 * Authority
37    
38     [81] [[IPアドレス]]を使うことは可能な限り避ける[['''べきです''']] [SRC[>>18]]。
39    
40 wakaba 1.17 [87] 仕様上は、 [CODE(ABNF)@en[[[userinfo]]]] を使うことは認められていません。
41 wakaba 1.18 これは >>97 から [[RFC 2616]] (>>86) までずっと変わっていません。
42    
43     ;; [98] 認められなかったというよりは、単に追加されなかっただけでしょうな。
44     初期の [[HTTP]] には[[認証]]が何も実装されていませんでしたから。
45 wakaba 1.12
46 wakaba 1.10 ** 串における処理
47    
48     [83] [[串]]は、[[ホスト名]]が [[FQDN]] でなければ、[[ホスト名]]を追加して[['''構いません''']]。
49     [[FQDN]] は書き換えては[['''なりません''']]。 [SRC[>>18]]
50    
51     * Port
52    
53     [20] [[既定のポート]]は [CODE[[[80]]]] です [SRC[>>18]]。
54    
55     * Path
56    
57     [82] [[path]] が省略されている場合、 [[HTTP]] [[要求]]の [CODE(ABNF)@en[[[Request-URI]]]]
58     としては「[CODE(URI)@en[[[/]]]]」を使わなければ[['''なりません''']] [SRC[>>18]]。
59 wakaba 1.2
60 wakaba 1.22 ** ディレクトリー
61    
62 wakaba 1.23 [107] [CODE(URI)@en[[[http:]]]] [[URL]] の [[path]] の末尾が [CODE(URI)[[[/]]]] で終わる場合、
63 wakaba 1.22 [[ファイル・システム]]の類似の概念になぞらえて「[[ディレクトリー]]」や「[[フォルダー]]」
64     と呼ぶことがあります。 [[URL]] 仕様上も [CODE(URI)@en[[[http:]]]]
65     [[URL]] 仕様上も「[[ディレクトリー]]」という概念は存在しませんが、そもそも
66     [[URL]] の「[CODE(URI)[[[/]]]]」は[[ディレクトリー]]に由来していますし、
67     現在でも [CODE(URI)@en[[[http:]]]] [[URL]] の [[path]] を[[ファイル・システム]]の [[path]]
68     に対応付けることがしばしばあるため、慣用的に用いられています。
69    
70     [108] [CODE(URI)@en[http://example/a/]] という[[ディレクトリー]]と
71     [CODE(URI)@en[http://example/a]] は同じではありません。前者が存在しても、
72     後者は存在しないかもしれません。ですが、実際には [[HTTP]]
73     を[[ファイル・システム]]に対応付けるよう[[鯖]]が設定されている場合には後者から前者へと[[リダイレクト]]されるのが普通です。
74    
75     [109] [[ディレクトリー]]は [CODE(URI)[[[/]]]] で終わるのが正式である (ことが多い) のでそちらの [[URL]]
76     を使うべきだとの意見や、無駄な[[リダイレクト]]が発生するから [CODE(URI)[[[/]]]]
77     で終わり[[リダイレクト]]されない [[URL]] を使うべきだとの意見もあります。
78    
79 wakaba 1.23 ** 拡張子
80    
81     [110] [CODE(URI)@en[[[http:]]]] [[URL]] の [[path]] の末尾が [CODE(file)[[[.]]]]
82     と数文字の[[英数字]]で終わる場合、[[ファイル・システム]]の類似の概念になぞらえて「[[拡張子]]」
83     と呼ぶことがあります。 [[URL]] の仕様上も [[HTTP]] でも「[[拡張子]]」
84     という概念は存在しませんが、 [CODE(URI)@en[[[http:]]]] [[URL]] の [[path]]
85     を[[ファイル・システム]]の [[path]] に対応付けることがしばしばあるため、
86     慣用的に用いられています。
87    
88     [111] [[HTTP]] の仕様上は不透明な [[path]] の一部であり[[プロトコル]]上や[[クライアント]]の動作には影響しないはずですが、
89     便宜上、[[利用者エージェント]]の一部の動作に影響することがあります。例えば、
90     [CODE(URI)@en[[[http:]]]] [[URL]] の[[拡張子]]が[[画像]]を表すものかどうかによって挙動が変わることがあります。
91    
92     ;; [112] [[HTTP]] の仕様の想定としては実際にアクセスして [CODE(HTTP)@en[[[Content-Type]]]]
93     を見て挙動を変えるのが適切なのでしょうが、 [[URL]] だけを見て、
94     ネットワーク・アクセスを発生させずに挙動を決定するには[[拡張子]]が便利なので、
95     しばしば用いられるのです。
96    
97     [113] [[拡張子]]は、 [[HTTP]] [[鯖]]において [[HTTP]]
98     [[実体頭欄]]を決定したり、[[内容折衝]]を行ったりする際の情報として利用されることがあります。
99     例えば [[Apache]] の [[mod_mime]] は、 [CODE@en[[[AddType]]]] や
100     [CODE@en[[[AddCharset]]]] などの[[指令]]によって決まる[[拡張子]]と[[MIME型]]などの対応情報に基づき、
101     [CODE(HTTP)@en[[[Content-Type]]]] [[頭欄]]などを決定したり、[[内容折衝]]を行ったりします。
102    
103 wakaba 1.19 ** 予約されている path
104    
105     [99] 次に述べる [[path]] は、公式または非公式に予約されていて、特定の目的に使われます。
106    
107     - [100] [CODE(URI)@en[/[[robots.txt]]]]
108     - [101] [CODE(URI)@en[/[[favicon.ico]]]]
109     - [12] [CODE(URI)@en[[[/.well-known/]]]]
110 wakaba 1.2
111 wakaba 1.20 ** ホーム・ディレクトリー
112    
113     [102] [CODE(URI)@en[http://[VAR[host]]/~[VAR[username]]/[VAR[path]]]] のような [[URL]]
114 wakaba 1.21 は、[[利用者]] [VAR[username]] に割り当てられた領域を意味するものとして使う慣習があります。
115 wakaba 1.20 [VAR[host]] は通常は [[ISP]] や[[大学]]などの所有する[[ドメイン名]]であり、
116     [[会員]]や[[教員]]・[[学生]]に [[Web]] 公開用の領域として割り当てています。
117    
118     [103] [CODE(URI)[[[~]]]] は、 [[Unix]] で[[ホーム・ディレクトリー]]を表す記号として用いられていて、
119     それをそのまま [[URL]] として使っているものと推測されます。
120    
121 wakaba 1.21 [104] [[Apache]] などの普及している
122 wakaba 1.20 [[HTTP]] [[鯖]]の既定の設定においては、 [CODE(URI)@en[/~[VAR@en[username]]/]]
123     は[[ファイル・システム]]上の [CODE(file)@en[~[VAR@en[username]]/[[public_html]]/]]
124     に対応します。
125    
126 wakaba 1.21 [105] 近年では組織が構成員に [[Web]] 用の領域を割り当て、
127     そこを使って [[Webサイト]]を公開することが少なくなってきたので、
128     この形式の [[URL]] を見ることも減ってきました。 [TIME[2011-02-27T14:13:06.00Z]]
129    
130 wakaba 1.22 [106] なお、 [CODE(URI)[[[~]]]] は古い [[RFC]] では使用が認められておらず、
131     [CODE(URI)@en[[[%7E]]]] と[[百分率符号化]]しなければならなかったにも関わらず、
132     この慣習は広く行われており、 [CODE(URI)[[[~]]]] をそのまま使った [[URL]]
133     も昔からよく見かけました。結局 [CODE(URI)[[[~]]]] は仕様上も追認されることになるのですが、
134     それまでは [CODE(URI)@en[[[%7E]]]] と書くべきだとか、そもそも [CODE(URI)[[[~]]]]
135     を使うのは好ましくないだとかいった議論がしばしばなされました。
136    
137 wakaba 1.16 * 長さ
138    
139     [94] [[URLの長さ]]を参照してください。
140    
141 wakaba 1.14 * 正準形
142    
143     [92] [[HTTPにおけるURLの比較]]を参照してください。
144    
145 wakaba 1.7 * 処理モデル
146 wakaba 1.2
147 wakaba 1.11 ** 比較
148    
149     [84] いつ使うのかは不明確ではありますが、 [[HTTPにおけるURLの比較]]の方法が定義されています。
150    
151 wakaba 1.7 ** フォーム提出
152 wakaba 1.2
153 wakaba 1.7 [11] [CITE@en-GB-x-Hixie[Web Forms 2.0]] ([TIME[2009-01-05 20:07:15 +09:00]] 版) <http://www.whatwg.org/specs/web-forms/current-work/#for-http>
154 wakaba 1.2
155 wakaba 1.7 * 不思議解釈
156 wakaba 1.2
157     [4]
158    
159     > RFC 2616 には HTTPプロトコルに関することが書かれており,3.2.2 http URL に書かれている http URL も,HTTPプロトコルの中での話になります.一般に,HTML のリンクに使用されるものは,純粋に HTTPプロトコルの中で使用される http URL ではなく, scheme が http であるURI References です.
160    
161     出典: [CITE[Perlメモ]] <http://www.din.or.jp/%7Eohzaki/perl.htm#httpURL>
162     (2005年3月現在)
163    
164     このような解釈は正しく'''ありません'''。 [[IANA]]
165     の [[URI scheme]] 登録簿に拠れば [CODE(URI)[[[http]]:]]
166     URI scheme の出典は [[RFC 2616]] であり、 [[IETF]]
167     的に有効な [CODE(URI)[[[http]]:]] [[URI]] の規定は
168     ([[HTTP]] であれ [[HTML]] であれ、その他の文脈であれ)
169     [[RFC 2616]] だけです。
170    
171     更に
172    
173     > たとえば http://user:passwd@www.din.or.jp/~ohzaki/perl.htm#URI は URI References ですが,user:passwd@ の部分,すなわち,userinfo や,#URI の部分,すなわち, Fragment Identifier は HTTPプロトコルの中で使用される http URL としては不正なものとなります.しかし,HTML のリンクとしては問題ありません.なぜなら,クライアント(ブラウザ)が HTTPプロトコルで通信する際にはそれらを削除しているからです.
174    
175     と説明がありますが、このような議論は実装がそうであるというだけで、
176     仕様がそうであるとの根拠はありません。
177     ([[RFC 2396]] の時代に [[URI参照]]の一部分ではあっても [[URI]]
178     の一部分ではなかった[[素片識別子]]は別として、)
179     単に仕様と実世界が整合していないというだけであって、
180     [[HTTP]] で使うか [[HTML]] で使うかは関係ありません。
181    
182     個々の [[URI scheme]] の規定は [[RFC 2396]] (や新しい [[RFC 3986]])
183     の一般の規定に優先するので、 [[RFC 2396]] で許されるように見えても
184     [[RFC 2616]] で許されないものは、すべて認められません。
185    
186     ([CODE(URI)[[[ftp]]:]] [[URI]] に関する部分にも同様の指摘ができます。
187     ただし [CODE(URI)[[[ftp]]:]] [[URI scheme]] の仕様は未だにいにしえの
188     [[RFC 1738]] のままで、実装とまったく整合していません。)
189    
190 wakaba 1.7 * 歴史
191 wakaba 1.2
192 wakaba 1.18 ** 太古の定義
193    
194     [97] [CITE[HTTPAddressing -- /Addressing]] ([TIME[1992-04-13 17:08:21 +09:00]] 版) <http://www.w3.org/History/19921103-hypertext/hypertext/WWW/Addressing/HTTPAddressing.html>
195    
196 wakaba 1.17 ** RFC 1630 の定義
197    
198     [96] [CITE@en[RFC 1630 - Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the World-Wide Web]]
199     <http://tools.ietf.org/html/rfc1630#page-13>
200    
201     ** RFC 1738 の定義
202    
203     [95] [CITE@en[RFC 1738 - Uniform Resource Locators (URL)]]
204     <http://tools.ietf.org/html/rfc1738#section-3.3>
205    
206 wakaba 1.13 ** RFC 1945、RFC 2068 の定義
207 wakaba 1.2
208 wakaba 1.13 [2] [CODE(HTTP)@en[[[http:]]]] [[URL]] は [[HTTP/1.0]]、[[HTTP/1.1]] の仕様の一部として
209     [[RFC 1945]] 3.2 [SRC[>>90]]、[[RFC 2068]] 3.2 で規定されました。
210 wakaba 1.3
211 wakaba 1.13 [88] この仕様は当時の [[URL]] の正式な規定であるところの [[RFC 1738]] や [[RFC 1808]]
212     に[[意図的違反]]していました。具体的には、本来 [[URL]] では使えないはずの [CODE(ABNF)@en[[[national]]]]
213     の[[オクテット]] (つまり任意の[[オクテット]]) が認められていたりしました。
214     その理由としては、[[鯖]]は[[文字]]の制約に縛られていないこと、
215     [[串]]はどのみち受け入れるしかないことが挙げられていました。
216    
217     ;; [91] [[誤り処理]]であるとも取れますが、曖昧ですな。
218    
219     [89]
220     なんかこの [[ABNF]] 構文破綻してる気がしますが。。。
221 wakaba 1.7 例えば [CODE(ABNF)[segment = 2068.segment - "/"]]
222     と定義しておかないと[[欲張り]]過ぎるんじゃ?
223 wakaba 1.4
224 wakaba 1.14 *** 仕様書
225 wakaba 1.13
226     - [90] [CITE@en[RFC 1945 - Hypertext Transfer Protocol -- HTTP/1.0]]
227     <http://tools.ietf.org/html/rfc1945#section-3.2.2>
228 wakaba 1.15 - [93] [CITE@en[RFC 2068 - Hypertext Transfer Protocol -- HTTP/1.1]]
229     <http://tools.ietf.org/html/rfc2068#section-3.2.2>
230 wakaba 1.13
231 wakaba 1.12 ** RFC 2616 の定義
232    
233 wakaba 1.13 [85] [[RFC 2068]] の改訂である [[RFC 2616]] では、 [CODE(ABNF)@en[[[national]]]]
234     を認めていた独自の定義は削除され、 [[RFC 2396]] に定義を委ねる形になっています。
235 wakaba 1.12
236     [86]
237     >
238     [PRE(ABNF code)[
239     http_URL = "http:" "//" host [ ":" port ] [ abs_path [ "?" query ]]
240     ]PRE]
241    
242 wakaba 1.6 * テスト・ケース
243    
244     [1] ''Another HTML-lint : Explanation'' <http://openlab.ring.gr.jp/k16/htmllint/explain.html#illegal-format-url>
245     正しくない [[URI]] の例が幾つかあります。
246    
247 wakaba 1.4 * 関連
248    
249 wakaba 1.7 [16] [CODE(URI)@en[[[http:]]]] に非常によく似た [[URL scheme]] として、
250     [[HTTP/TLS]] を表す [CODE(HTTP)@en[[[https:]]]]、 [[SHTTP]] を表す
251     [CODE(HTTP)@en[[[shttp:]]]] があります。
252    
253 wakaba 1.8 [17] [[Web]] の[[掲示板]]などでは、 [CODE(HTTP)@en[[[http:]]]] [[URL]] を検知して自動的に[[ハイパーリンク]]として解釈する機能が適用されることを防ぐため、
254     [CODE(HTTP)@en[[[ttp:]]]]、[CODE(HTTP)@en[[[tp:]]]]、[CODE(HTTP)@en[[[p:]]]]
255     といった [[URL scheme]] を用いたり、 [[URL scheme]] を省略して [CODE(URI)[[[:]]]]
256     から始めたり、 「[CODE(HTTP)@en[[[http]]]]」の一部又は全部を[[全角]]で表記したりすることがあります。
257    
258 wakaba 1.4 [13] [[HTTPにおけるURL]]の項もご覧ください。

admin@suikawiki.org
ViewVC Help
Powered by ViewVC 1.1.24