關於 Applebot

了解 Applebot (Apple 的網絡爬蟲)。

Applebot 是 Apple 的網絡爬蟲,Siri 和 Spotlight 等產品均使用 Applebot。Applebot 遵守慣用的 robots.txt 規則和機械人中繼標記,來自 17.0.0.0 網絡區塊。

識別 Applebot

用戶代理程式字串會包含「Applebot」以及額外的代理程式資料,例如:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Applebot/0.1)

自訂 Applebot 規則

Applebot 遵守針對 Applebot 的標準 robots.txt 指令。在此例子中,Applebot 不會嘗試對 /private/ 或 /not-allowed/ 底下的文件進行索引:

User-agent: Applebot         # apple
Disallow: /private/          # disallow this directory
User-agent: *                # any robot
Disallow: /not-allowed/      # disallow this directory

Applebot 支援 HTML 文件的機械人中繼標記。如要指定中繼標記的機械人規則,請將標記放在文件的 <HEAD> 部分,就像這樣:

<html><head>
<meta name="robots" content="noindex"/>
...
</head>
<body>...</body>
</html>


Applebot 也支援以下指令:

  • noindex:Applebot 不會就頁面建立索引,頁面也不會在 Spotlight 或 Siri 中顯示。
  • nosnippet:Applebot 不會就頁面產生描述。任何進入此網址的建議只會包括頁面標題。
  • nofollow:Applebot 不會追蹤頁面上的任何連結。
  • none:如上文所述,Applebot 不會建立頁面索引、網頁摘要或追蹤頁面上的連結。
  • all:Applebot 會提供建議文件並截取網頁摘要,以便在能代表該頁面的圖片旁邊顯示簡短的頁面描述。Applebot 可能會追蹤頁面連結,以提供進一步建議。

如要在單一中繼標記放入多項指令,請使用逗號分隔的清單或多個中繼標記。部分例子如下:

<meta name="robots" content="nosnippet, noindex”>

以及:

<meta name="robots" content=“noindex">
<meta name="robots" content=“nosnippet">

聯絡我們

如有任何問題或疑慮,請電郵至 applebot@apple.com 與我們聯絡。

發佈日期: