Acerca do Applebot
Saiba mais sobre o Applebot, o rastreador web para a Apple.
Os dados indexados pelo Applebot são utilizados para várias funcionalidades, como a tecnologia de pesquisa que está integrada em muitas experiências do utilizador no ecossistema da Apple, incluindo o Spotlight, a Siri e o Safari. A ativação do Applebot em robots.txt permite que o conteúdo do site apareça nos resultados da pesquisa dos utilizadores da Apple em todo o mundo nestes produtos.
O Applebot acede a vários tipos de recursos de servidores web, incluindo, sem limitações, robots.txt, mapas do site, feeds RSS, HTML, recursos secundários necessários para processar páginas (como JavaScript), pedidos Ajax, imagens e muito mais.
Identificar o Applebot
O tráfego proveniente do Applebot é geralmente identificado através da utilização de DNS inverso no domínio *.applebot.apple.com.
Outra forma é combinar o endereço IP com um prefixo CIDR contido no seguinte ficheiro JSON: CIDR de IP do Applebot.
DNS inverso
O comando host pode ser utilizado para determinar se um endereço IP faz parte do Applebot. Estes exemplos mostram o comando host e o respetivo resultado:
$ host 17-58-101-179.applebot.apple.com 17-58-101-179.applebot.apple.com has address 17.58.101.179.
O comando host também pode ser utilizado para verificar se o DNS aponta para o mesmo endereço IP:
$ host 17.58.101.179 179.101.58.17.in-addr.arpa domain name pointer 17-58-101-179.applebot.apple.com.
Agentes de utilizador
Um agente de utilizador ajuda os webmasters a identificarem o tráfego de rastreadores, para que possam obter relatórios de registo de acesso precisos da atividade de rastreadores e controlar o acesso ao site através de robots.txt.
O Applebot suporta vários agentes de utilizador, incluindo agentes de Pesquisa e Podcasts.
Pesquisa
Para rastreamento e processamento de pesquisas na web, o Applebot utiliza o seguinte formato:
A cadeia do agente de utilizador contém "Applebot" e outras informações. O formato geral é o seguinte:
Mozilla/5.0 (Device; OS_version) AppleWebKit/WebKit_version (KHTML, like Gecko)Version/Safari_version [Mobile/Mobile_version] Safari/WebKit_version (Applebot/Applebot_version; +http://www.apple.com/go/applebot)
Exemplo para computadores:
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15(KHTML, like Gecko) Version/17.4 Safari/605.1.15 (Applebot/0.1; +http://www.apple.com/go/applebot)
Exemplo para telemóveis:
Mozilla/5.0 (iPhone; CPU iPhone OS 17_4_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.4.1 Mobile/15E148 Safari/604.1 (Applebot/0.1; +http://www.apple.com/go/applebot)
Ocasionalmente, o Applebot irá atualizar a versão do navegador que anuncia, mantendo simultaneamente o formato geral indicado acima.
Apple Podcasts
O tráfego iTMS também pode ser proveniente de hosts applebot.apple.com e será identificado pelo seguinte agente de utilizador:
User-Agent: iTMS
O agente de utilizador iTMS não segue o ficheiro robots.txt, uma vez que não é um rastreador de pesquisa geral. Este agente só rastreia URL associados a conteúdo registado no Apple Podcasts.
Personalizar as regras de robot.txt
O Applebot respeita as diretivas padrão de robots.txt em rastreamentos de pesquisa gerais direcionados para o Applebot. Neste exemplo, o Applebot não tenta rastrear documentos que estão sob /private/ ou /not-allowed/:
User-agent: Applebot Allow: / Disallow: /private/ User-agent: * Disallow: /not-allowed/
Se as instruções dos robôs não mencionarem o Applebot mas sim o Googlebot, o robô da Apple irá seguir as instruções Googlebot.
Processamento e regras do robô
O Applebot pode processar o conteúdo do seu site num browser. Se javascript, CSS e outros recursos forem bloqueados através de robots.txt, poderá não ser possível processar o conteúdo corretamente. Isto inclui XHR, JS e CSS de que a página possa necessitar.
Para que o Applebot possa indexar o melhor conteúdo para a página, certifique-se de que tudo o que é necessário para que um utilizador processe a página está disponível para o Applebot. Em alternativa, certifique-se de que o site é corretamente processado, mesmo que nem todos os recursos estejam disponíveis. Isto é frequentemente designado por uma degradação graciosa.
Personalizar regras de indexação para o Applebot
O Applebot suporta meta tags para robôs em documentos HTML. Para especificar regras de robôs em meta tags, coloque as tags na
... ...
O Applebot também suporta as seguintes diretivas:
noindex: o Applebot não irá indexar esta página e não aparecerá nas Sugestões do Spotlight ou da Siri.
nosnippet: o Applebot não irá gerar uma descrição ou resposta Web para a página. Quaisquer sugestões para visitar este URL incluirão apenas o título da página.
nofollow: o Applebot não irá seguir quaisquer ligações na página.
none: o Applebot não irá indexar, retirar excertos nem seguir ligações na página, como descrito acima.
all: o Applebot fornece o documento para sugestões e irá retirar excertos dos conteúdos para que uma breve descrição da página possa ser apresentada junto de uma imagem representativa. O Applebot poderá seguir ligações na página para fornecer mais sugestões.
Para colocar várias diretivas numa única meta tag, utilize uma lista separada por vírgulas ou várias meta tags.
Exemplo:
Controlar a utilização de dados
Além de seguir todas as regras e diretivas de robots.txt, a Apple tem um agente de utilizador secundário, o Applebot-Extended, que dá aos editores web controlos adicionais sobre a forma como o conteúdo dos respetivos sites pode ser utilizado pela Apple.
Com o Applebot-Extended, os editores web podem optar por não permitir que o conteúdo dos respetivos sites seja utilizado para treinar os modelos básicos da Apple utilizados por funcionalidades de IA generativa nos produtos Apple, incluindo o Apple Intelligence, Serviços e Ferramentas para programadores.
Pode adicionar uma regra em robots.txt para não permitir o Applebot-Extended, da seguinte forma:
User-agent: Applebot-Extended Disallow: /private/
O Applebot-Extended não efetua o rastreamento de páginas web. As páginas web que não permitem o Applebot-Extended ainda podem ser incluídas nos resultados da pesquisa. O Applebot-Extended é utilizado apenas para determinar como são utilizados os dados rastreados pelo agente de utilizador do Applebot.
Permitir o Applebot-Extended ajudará a melhorar as capacidades e a qualidade dos modelos de IA generativa da Apple ao longo do tempo.
Acerca das classificações de pesquisa
A Pesquisa da Apple pode tomar os fatores seguintes em consideração ao classificar os resultados da pesquisa na web:
Envolvimento do utilizador agregado com os resultados da pesquisa
Relevância e correspondência dos termos da pesquisa com tópicos e conteúdos de páginas web
Número e qualidade das ligações de outras páginas na web
Sinais baseados na localização do utilizador (dados aproximados)
Características do design da página Web
Os resultados da pesquisa podem utilizar os fatores acima mencionados sem importância (pré-determinada) de classificação. Os utilizadores da Pesquisa estão sujeitos à política de privacidade em Sugestões de Siri, Pesquisa e Privacidade.
Contacte-nos
Se tiver perguntas ou preocupações, contacte-nos através do endereço de e-mail applebot@apple.com.
As informações sobre os produtos não fabricados pela Apple ou os sites independentes não controlados ou testados pela Apple são disponibilizadas sem recomendações nem aprovação. A Apple não assume qualquer responsabilidade no que diz respeito à seleção, ao desempenho ou à utilização dos sites ou produtos de terceiros. A Apple não garante a precisão nem a fiabilidade dos sites de terceiros. Contacte o fornecedor para obter mais informações.