Applebot について

Apple の Web クローラー、Applebot について説明します。

Applebot は、Apple の Web クローラーです。Siri や Spotlight 検索候補などの製品は、Applebot を利用しています。

Applebot を確認する

Applebot からの着信トラフィックはユーザエージェントで区別でき、逆引き DNS で調べると、*.applebot.apple.com ドメインに属していて、17.0.0.0 ネットブロックが発信元であることがわかります。

Applebot からのトラフィックを確認する

macOS では、host コマンドを使って、IP アドレスが Applebot のものかどうかを判断できます。以下の例は、host コマンドとその結果です。

$ host 17.58.101.179
179.101.58.17.in-addr.arpa domain name pointer 17-58-101-179.applebot.apple.com.

host コマンドを使って、DNS が同じ IP アドレスを参照しているか確かめることもできます。

$ host 17-58-101-179.applebot.apple.com
17-58-101-179.applebot.apple.com has address 17.58.101.179.

Applebot ユーザエージェントを確認する

user-agent 文字列には「Applebot」とその他の情報が含まれています。フォーマットは以下の通りです。

Mozilla/5.0 (Device; OS_version) AppleWebKit/WebKit_version (KHTML, like Gecko)
Version/Safari_version Safari/WebKit_version (Applebot/Applebot_version)

デスクトップの場合の例:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5
(KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Applebot/0.1)
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/605.1.15
(KHTML, like Gecko) Version/12.1.1 Safari/605.1.15 (Applebot/0.1)

モバイルの場合の例:

Mozilla/5.0 (iPhone; CPU iPhone OS 8_1 like Mac OS X) AppleWebKit/600.1.4
(KHTML, like Gecko) Version/8.0 Mobile/12B410 Safari/600.1.4 (Applebot/0.1;
+http://www.apple.com/go/applebot)
Mozilla/5.0 (iPhone; CPU iPhone OS 13_4_1 like Mac OS X) AppleWebKit/605.1.15Z
(KHTML, like Gecko) Version/13.1 Mobile/15E148 Safari/604.1 (Applebot/0.1)

「robot.txt」のルールをカスタマイズする

Applebot は、Applebot を対象とした「robots.txt」の標準的なディレクティブに従います。以下の例では、Applebot は「/private/」や「/not-allowed/」の下位にある書類はクローリングしません。

User-agent: Applebot         # apple
Allow: /                     # Allow everything (also true if omitted)
Disallow: /private/          # disallow this directory
User-agent: *                # any robot
Disallow: /not-allowed/      # disallow this directory

robots の制御指示で Applebot には言及していなくても Googlebot について指定されている場合、Apple のロボットは Googlebot に対する指示に従います。

 

レンダリングと robots のルール

Applebot はブラウザ内で Web サイトのコンテンツをレンダリングする場合があります。javascript、CSS、その他のリソースが「robots.txt」でブロックされている場合は、コンテンツを適切にレンダリングできない場合があります。これには、ページで必要とされる可能性がある XHR、JS、CSS なども該当します。

Applebot でページのコンテンツが適切にインデックス化されるようにするには、ユーザがページをレンダリングするために必要な情報をすべて Applebot でも利用できるようにしておいてください。または、リソースがすべて利用できない状態であっても、Web サイトが滞りなくレンダリングされるようにしておきましょう。これはよく「グレースフルデグレーション」と呼ばれる手法です。

Applebot に対するインデックス化のルールをカスタマイズする

Applebot は、HTML 書類の robots meta タグに対応しています。メタタグに robots のルールを指定するには、以下のように、書類の <head> セクションにタグを追加します。

<html><head>
 <meta name="robots" content="noindex"/>
 ...
 </head>
 <body>...</body>
 </html>

Applebot は以下のディレクティブにも対応しています。

  • noindex:このページは Applebot でインデックス化されないため、Spotlight や Siri の検索候補にも表示されません。
  • nosnippet:Appletbot は、このページの説明 (スニペット) を生成しません。この URL が閲覧候補として提示される際も、ページのタイトルしか表示されません。
  • nofollow:Applebot は、このページ上のリンクをたどりません。
  • none:Applebot は、上記の通り、ページをインデックス化せず、スニペットを生成せず、ページ上のリンクをたどりません。
  • all:Applebot はこの書類を提案に使い、コンテンツのスニペットを生成するため、ページの簡単な説明が、ページを表す画像の横に表示されます。Applebot はページ上のリンクをたどり、さらに候補を提示する場合があります。

1 つのメタタグに複数のディレクティブを指定するには、カンマ区切りのリスト形式で指定するか、メタタグを複数使います。以下に例を紹介します。

<meta name="robots" content="nosnippet, noindex”>
<meta name="robots" content=“noindex">
<meta name="robots" content=“nosnippet">

検索ランキングについて

Apple の検索では、Web の検索結果にランク付けをする際、以下の点を考慮に入れています。

  • 検索結果に対するユーザエンゲージメントの集計
  • 検索語と Web ページのトピックやコンテンツとの関連度やマッチング
  • Web 上のほかのページからのリンクの数や質
  • ユーザの位置情報に基づくシグナル (近似データ)
  • Web ページのデザインの特徴

検索結果には、上記の要因が加味される場合がありますが、ランキングにおける重要度はあらかじめ決められてはいません。検索機能の利用には、「Siriからの提案、検索とプライバシー」のプライバシーポリシーが適用されます。

Apple サポートに問い合わせる

ご質問やご不明な点がございましたら、applebot@apple.com までお問い合わせください。

Apple が製造していない製品に関する情報や、Apple が管理または検証していない個々の Web サイトについては、推奨や承認なしで提供されています。Apple は他社の Web サイトや製品の選択、性能、使用に関しては一切責任を負いません。Apple は他社の Web サイトの正確性や信頼性についてはいかなる表明もいたしません。詳しくは各メーカーや開発元にお問い合わせください。

公開日: