[44] [DFN[[CODE(HTML)@en[<[[meta]] [[name]]=[[robots]]>]]]] は[[ロボット]]による当該 [[HTML]]
[[文書]]の扱いを指定するものです。
* 仕様書
[REFS[
- [1] robotstxt.org
-- [40] '''[CITE[The Web Robots Pages]] ([TIME[2013-03-10 05:10:11 +09:00]] 版) '''
-- [42] [CITE[The Web Robots Pages]] ([TIME[2013-03-10 05:11:35 +09:00]] 版)
-- [41] [CITE[Robots Exclusion]]
- [7] [CITE@ja[メタ タグ - ウェブマスター ツール ヘルプ]] ([TIME[2013-03-10 04:39:35 +09:00]] 版)
- [31] [CITE@en[MetaExtensions - WHATWG Wiki]] ([TIME[2013-02-20 20:48:01 +09:00]] 版)
- [38] [CITE[自分のサイトを更新チェックされたくない - はてなアンテナのヘルプ]] ([TIME[2013-03-10 05:06:30 +09:00]] 版)
]REFS]
* 名前
[25] 名前 ([CODE(HTMLa)@en[[[name]]]] [[属性]]の値) は[[ASCII大文字・小文字不区別]]です [SRC[[[HTML]]]]。
[26] 名前として標準では [CODE(HTML)@en[[[robots]]]] が使われていますが、
各[[ロボット]]が独自の値を規定しています。
[FIG[
- [28] [CODE(HTML)@en[[[googlebot]]]] [SRC[>>7, >>31]]
- [39] [CODE(HTML)@en[[[hatena]]]] [SRC[>>38]]
- [37] [CODE(HTML)@en[[[ia_archive]]]] ([[Internet Archive]]) [SRC[>>31]]
- [36] [CODE(HTML)@en[[[msnbot]]]] [SRC[>>31]]
- [27] [CODE(HTML)@en[[[robots]]]] (全[[ロボット]]) [SRC[>>1, >>31]]
- [34] [CODE(HTML)@en[[[slurp]]]] ([[Yahoo!]]) [SRC[>>31]]
- [35] [CODE(HTML)@en[[[teoma]]]] ([[Teoma]], [[Ask.com]]) [SRC[>>31]]
]FIG]
* 値
[14] 値 ([CODE(HTMLa)@en[[[content]]]] [[属性]]の値) は[[大文字・小文字不区別]]です [SRC[>>5, >>7]]。
[15] 値としてキーワードを複数指定するときは [CODE[[[,]]]] を使いますが、[[スペース]]をも含めても構いません [SRC[>>5]]。
[16] キーワードとしては次のものがあります。
[FIG[
- [43] [CODE(HTML)@en[[[all]]]]
- [24] [CODE(HTML)@en[[[follow]]]]
- [23] [CODE(HTML)@en[[[index]]]]
- [20] [CODE(HTML)@en[[[noarchive]]]]
- [19] [CODE(HTML)@en[[[nofollow]]]]
- [29] [CODE(HTML)@en[[[noimageindex]]]]
- [18] [CODE(HTML)@en[[[noindex]]]]
- [17] [CODE(HTML)@en[[[none]]]]
- [22] [CODE(HTML)@en[[[noodp]]]]
- [21] [CODE(HTML)@en[[[nosnippet]]]]
- [32] [CODE(HTML)@en[[[noydir]]]]
- [30] [CODE(HTML)@en[[[unavailable_after]]:...]]
]FIG]
* 仕様書から
** Google のヘルプ
[9] >>7 には次のようにあります [TIME[2013-03-10T04:42:25.100Z]]:
[FIG[
[8]
>
[PRE(HTML code)[
]PRE]
>
クロールとインデックス登録を行う検索エンジンの動作を制御します。robots メタ タグはすべての検索エンジンに有効ですが、googlebot メタ タグは Google でのみ有効です。デフォルト値は「all」と同じ意味の「index, follow」で特に指定する必要はありません。Google では次の値をサポートしています(複数の値を指定する場合はカンマで区切ります)。
-[CODE(HTML)@en[noindex]]: ページをインデックスに登録しないようにします
-[CODE(HTML)@en[nofollow]]: Googlebot がページのリンクを追跡しないようにします
-[CODE(HTML)@en[nosnippet]]: 検索結果にスニペットを表示しないようにします
-[CODE(HTML)@en[noodp]]: ODP/DMOZ の代替説明を使用しないようにします
-[CODE(HTML)@en[noarchive]]: Google でページのキャッシュ リンクを表示しないようにします
-[CODE(HTML)@en[unavailable_after:[date] ]]: ページのクロールとインデックス登録を中止する正確な日時を指定します
-[CODE(HTML)@en[noimageindex]]: Google の検索結果に表示される画像の参照元ページとしてページを表示しないようにします
>HTTP ヘッダーの「X-Robots-Tag」ディレクティブを使用して、ページのヘッダーに情報を記述することもできます。これは、画像や他のドキュメントなど、HTML 以外のファイルに対するインデックス登録を制限する場合に特に便利です。robots.txt について詳しくはこちらをご覧ください。
>
verify タグを除き、ほとんどのメタ タグでは大文字と小文字は区別されません。
]FIG]
* 歴史
** HTML4
[REFS[
- [10] [[HTML 4]]
-- [CITE[Robots and the META element]]
-- [2] [CSECTION[A.1.2 Errors that were corrected]]
]REFS]
[11] [[HTML 4]] は附属書 B (参考) で簡単に解説しているだけです。
[12] HTML 4.01 での修正を根拠に
[CODE(HTML)[ROBOTS]] の [CODE(HTMLa)[[[content]]]]
は大文字・小文字を区別するという説が出ましたが、
正式な仕様 [SRC[>>1]] では区別''しない''としており、
HTML 4 の記述は [CODE(HTMLa)[content]]
属性に関する一般論と [CODE(HTML)[ROBOTS]]
の時の属性値に関する話が混じって混乱を招いたのだと考えられています
[SRC[html-lint]]。
** [CODE(HTML)@en[noodp]]
[13] [CODE(HTML)@en[noodp]] は2006年7月に [[Google]] により追加されました。
[REFS[
- [4]
[CITE[Inside Google Sitemaps: More control over page snippets]] ([TIME[2007-12-05 05:16:03 +09:00]] 版)
- [3]
[CITE[Google supports META NOODP tag]] ([CODE[2008-01-31 08:41:04 +09:00]] 版)
]REFS]
** [CODE(HTML)@en[noydir]]
[REFS[
- [33] [CITE@en[Yahoo! Search Support for ‘NOYDIR’ Meta Tags and Weather Update]] ([TIME[2013-03-10 05:01:24 +09:00]] 版)
]REFS]
* メモ
[5] [CITE[Official Google Webmaster Central Blog: Using the robots meta tag]] ([CODE[2007-03-06 22:21:54 +09:00]] 版)
[6] [CITE[ACAP - Automated Content Access Protocol v1]]
( ([[IPTC PR Team]] 著, [TIME[2012-09-19 08:03:13 +09:00]] 版))
[45] [CITE@en[Robots meta tag and X-Robots-Tag HTTP header specifications - Webmasters — Google Developers]]
( ([TIME[2012-02-17 19:47:22 +09:00]] 版))