Co je to Applebot

Přečtěte si o Applebotu, webcrawleru společnosti Apple.

Data procházená Applebotem se používají k podpoře různých funkcí, například technologie vyhledávání integrované do mnoha uživatelských prostředí v ekosystému Apple, včetně Spotlightu, Siri a Safari. Povolením Applebotu v souboru robots.txt umožníte, aby se obsah webových stránek zobrazoval ve výsledcích vyhledávání uživatelům těchto produktů Apple z celého světa.

Data procházená Applebotem můžou být také použita k trénování základních modelů Apple pro funkce generativní umělé inteligence v produktech Apple, včetně Apple Intelligence, služeb a vývojářských nástrojů. Vydavatelé webových stránek můžou zakázat používání svého obsahu k trénování generativních základních modelů tak, že v souboru robots.txt zakážou Applebot-Extended.

Data procházená pomocí Applebotu můžou být použita k poskytování dodatečného kontextu a aktuálního obsahu, když se pomocí modelů AI generují výstupu určené k zobrazení v produktech a službách Apple. Například odpovídání na otázky vyžadující rozsáhlé znalosti v Siri a vyhledávání, které můžou zahrnovat odkazy na zdroje a webové stránky použité při generování odpovědi. Vydavatelé webových stránek můžou zabránit tomu, aby se jejich obsah v těchto odpovědích vyžadujících rozsáhlé znalosti používal, a to pomocí meta tagu nosnippet u konkrétního obsahu.

I když zakážete Applebot-Extended a označíte obsah webu pomocí meta tagu nosnippet, pokyny vašeho webu můžou stále Applebotu umožňovat procházení vašich webových stránek. Váš obsah zůstane na zařízeních Apple dostupný prostřednictvím Spotlightu, Siri a Safari i dalších systémových funkcí.

Identifikace Applebotu

Přenosy přicházející z Applebotu jsou obecně identifikovány pomocí reverzního DNS záznamu v doméně *applebot.apple.com.

Dalším způsobem je porovnat IP adresu s předponou CIDR obsaženou v následujícím souboru JSON: Applebot IP CIDRs.

Reverzní DNS záznam

Pomocí příkazu host lze zjistit, zda daná IP adresa patří Applebotu. Tyto příklady ukazují příkaz host a jeho výsledek:

$ host 17-58-101-179.applebot.apple.com

17-58-101-179.applebot.apple.com has address 17.58.101.179.

Příkaz host můžete použít i k ověření, jestli DNS ukazuje na stejnou IP adresu:

$ host 17.58.101.179

179.101.58.17.in-addr.arpa domain name pointer 17-58-101-179.applebot.apple.com.

Uživatelští agenti

Uživatelský agent pomáhá webmasterům identifikovat provoz prohledávače, aby mohli získat přesné protokoly přístupu o činnosti prohledávače a řídit přístup k webu prostřednictvím souboru robots.txt.

Applebot ovládá několik uživatelských agentů, včetně Hledání a Podcastů.

Hledat

K procházení a vykreslování webů pro vyhledávání používá Applebot následující formát:

Řetězec user-agent obsahuje „Applebot“ a další informace. Obecný formát je následující:

Mozilla/5.0 (zařízení; verze_OS) AppleWebKit/WebKit_version (KHTML, například Gecko)Version/verze_Safari [Mobilní zařízení/verze_mobilního_zařízení] Safari/verze_WebKitu (Applebot/verze_Applebotu; +http://www.apple.com/go/applebot)

Mozilla/5.0 (zařízení; verze_OS) AppleWebKit/verze_WebKitu (KHTML, například Gecko)Version/verze_Safari [Mobilní_zařízení/verze_mobilního_zařízení] Safari/verze_WebKitu (Applebot/verze_Applebotu; +http://www.apple.com/go/applebot)

Příklad pro stolní počítač:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15(KHTML, například Gecko) Version/17.4 Safari/605.1.15 (Applebot/0.1; +http://www.apple.com/go/applebot)

Příklad pro mobilní zařízení:

Mozilla/5.0 (iPhone; CPU iPhone OS 17_4_1 například Mac OS X) AppleWebKit/605.1.15 (KHTML, například Gecko) Version/17.4.1 Mobile/15E148 Safari/604.1 (Applebot/0.1; +http://www.apple.com/go/applebot)

Applebot příležitostně aktualizuje verzi prohlížeče, kterou udává, přičemž zůstává ve výše uvedeném obecném formátu.

Speciální prohledávací roboty

Online služby Apple

Přenosy iTMS můžou pocházet z hostitelů applebot.apple.com a budou identifikovány následujícím uživatelským agentem:

User-agent: iTMS

Uživatelský agent iTMS se neřídí souborem robots.txt, protože se nejedná o obecný prohledávač vyhledávání. Uživatelský agent iTMS prochází jenom adresy URL přidružené k registrovanému obsahu na Apple Podcasts.

Přizpůsobení pravidel souboru robots.txt

Applebot respektuje standardní direktivy souboru robots.txt v rámci obecného procházení vyhledávání, které je zacíleno na Applebota. V tomto příkladě se Applebot nebude pokoušet prohledávat dokumenty ve složkách /private/ a /not-allowed/:

User-agent: Applebot

Allow: /

Disallow: /private/

User-agent: *

Disallow: /not-allowed/

Pokud instrukce nezmiňují Applebot, ale zmiňují aspoň Googlebot, bude se robot Apple řídit instrukcemi pro Googlebot. Applebot nerespektuje crawl-delay.

Applebot je navržený s ohledem na efektivitu a upravuje se tak, aby co nejvíce omezil dopad na vlastníky webů. Například když web zpomalí nebo vrací chyby, rychlost procházení Applebotu se automaticky upraví, aby nedocházelo k přetěžování serverů webu. Apple taky ukládá procházený obsah do mezipaměti, aby omezil zbytečné procházení. Identifikace obsahu, který není třeba procházet, snižuje náklady na infrastrukturu pro vlastníky webů a zvyšuje celkovou efektivitu internetu.

Vykreslování a pravidla pro roboty

Applebot může obsah vašeho webu vykreslit ve svém prohlížeči. Pokud soubor robots.txt blokuje soubory CSS, javascript nebo jiné zdroje, nemusí se obsah stránek vykreslit správně. Sem patří i zdroje XHR, JS a CSS, které stránka může vyžadovat.

Aby mohl Applebot indexovat obsah vašeho webu co nejlépe, ujistěte se, že vše, co uživatel potřebuje k vykreslení stránky, je dostupné i pro Applebot. Případně zajistěte, aby se obsah webu vykresloval relativně správně, i když nejsou k dispozici všechny zdroje. To se někdy označuje jako půvabná nebo též elegantní degradace (graceful degradation).

Přizpůsobení pravidel indexování pro Applebot

Applebot podporuje metatagy robots v dokumentech HTML. Jestli chcete specifikovat značky meta pro boty, umístěte je v dokumentu do oddílu <head>:

<html>

<head>

<meta name="robots" content="noindex"/>

...

</head>

<body>...</body>

</html>

Applebot podporuje i následující příkazy:

  • noindex: Applebot nebude tuto stránku indexovat a stránka se nebude objevovat v návrzích Spotlightu ani Siri.

  • nosnippet: Applebot nebude pro tuto stránku generovat popis ani webové odpovědi. Veškeré návrhy na navštívení této adresy URL budou uvádět jen název stránky. Apple nebude používat data označená tagem nosnippet k poskytování dodatečného kontextu a aktuálního obsahu, když se pomocí modelů AI generují výstupy určené k zobrazení v produktech a službách Apple.

  • nofollow: Applebot nebude následovat žádné odkazy ze stránky.

  • none: Applebot nebude indexovat stránku, generovat její popis ani následovat odkazy, jak je popsáno výše.

  • all: Applebot zpřístupní stránku v návrzích a vygeneruje náhled jejího obsahu, aby se spolu s reprezentativním obrázkem stránky mohl zobrazovat i stručný popis. Applebot může následovat odkazy na stránce, aby mohl poskytovat další návrhy.

Pokud chcete do jednoho metatagu umístit víc příkazů, oddělte je čárkami, případně použijte víc meta tagů.

Příklad:

<meta name="robots" content="nosnippet, noindex”>

<meta name="robots" content=“noindex">

<meta name="robots" content=“nosnippet">

<meta name="applebot" content=“nosnippet">

Používání hlavičky HTTP X-Robots-Tag

Applebot taky podporuje direktivy pro indexování předávané prostřednictvím hlavičky HTTP odpovědi X-Robots-Tag. To je užitečné pro jiné zdroje než HTML (například PDF nebo obrázky), kde nejde použít meta tagy, nebo když chcete direktivy použít na úrovni serveru. Pokud chcete na Applebot použít direktivu:

X-Robots-Tag: applebot: nosnippet

Označování obsahu za paywallem

Applebot podporuje vlastnost schema.org isAccessibleForFree k identifikaci stránek, které jsou za paywallem, s měřeným přístupem nebo předplatným. Přidejte vlastnost do strukturovaných dat na úrovni stránky ve formátu JSON-LD:

<script type="application/ld+json">

{

"@context": "https://schema.org",

"isAccessibleForFree": false

}

</script>

Stránky označené isAccessibleForFree: false můžou být zobrazeny ve výsledcích vyhledávání, ale Applebot tento obsah nepoužije jako další kontext, když se používají modely umělé inteligence ke generování výstupu zobrazovaného v produktech a službách Apple. Tento signál se aplikuje na úrovni stránky. Anotování na úrovni sekcí pomocí hasPart není podporováno. Pokud chcete zabránit tomu, aby se váš obsah používal k trénování základních modelů Apple, použijte Applebot-Extended popsaný v následující části.

Applebot-Extended a kontrola využití dat

Kromě dodržování všech pravidel a direktiv souboru robots.txt má Apple sekundárního uživatelského agenta, Applebot-Extended, který poskytuje vydavatelům webů další možnosti kontroly nad tím, jak může Apple používat obsah jejich webových stránek.

Pomocí uživatelského agenta Applebot-Extended můžou vydavatelé webů vyloučit obsah svých webových stránek z používání k trénování obecných základních modelů Apple podporujících generativní funkce umělé inteligence napříč produkty Apple, včetně Apple Intelligence, služeb Apple a Developer Tools.

Do souboru robots.txt můžete přidat pravidlo, kterým uživatelského agenta Applebot-Extended zakážete:

User-agent: Applebot-Extended

Disallow: /private/

Applebot-Extended neprochází webové stránky. Webové stránky, které uživatelského agenta Applebot-Extended zakazují, můžou být stále zahrnuty do výsledků vyhledávání. Applebot-Extended se používá pouze k určení, jak používat data procházená uživatelským agentem Applebot.

Povolením uživatelského agenta Applebot-Extended pomůžete průběžně zlepšovat schopnosti a kvalitu generativních modelů umělé inteligence Apple.

Hodnocení ve vyhledávání

Apple Search může při hodnocení webů pro účely řazení výsledků vyhledávání brát v úvahu následující faktory:

  • Agregovaná interakce uživatelů s výsledky vyhledávání

  • Relevance a shoda vyhledávacích dotazů s tématem a obsahem stránky

  • Počet a kvalita odkazů z jiných stránek na webu

  • Signály založené na poloze uživatele (přibližná data)

  • Vlastnosti návrhu webové stránky

Výsledky vyhledávání mohou používat výše uvedené faktory bez (předem stanoveného) významu hodnocení. Uživatelé vyhledávání podléhají zásadám ochrany osobních údajů popsaným v dokumentu Návrhy Siri, hledání a soukromí.

Kontaktujte nás

Pokud máte nějaké dotazy nebo obavy, napište nám na adresu applebot@apple.com.

Informace o produktech, které nevyrábí Apple, a o nezávislých webech, které Apple nemá pod kontrolou a netestuje je, jsou poskytovány bez doporučení nebo záruky za jejich obsah. Apple v souvislosti s výběrem, výkonem nebo použitím webů nebo produktů třetích stran nepřebírá žádnou odpovědnost. Apple nijak nezaručuje přesnost nebo spolehlivost webů třetích stran. Další informace vám poskytne příslušný výrobce.

Datum zveřejnění: