Applebot 模型训练和个人隐私权

为了构建基础模型,从而为包括 Apple 智能、Apple 服务以及 Apple 开发者工具在内的所有 Apple 产品中的生成式 AI 功能提供底层支撑,Apple 会采用经第三方授权许可的信息、互联网上公开可获取的信息,以及通过合成手段生成的信息。在训练我们的基础模型时,我们不会使用作为用户隐私的个人数据或用户交互数据。

Apple 使用 Applebot 这一网页爬虫工具来抓取互联网上公开提供的信息。网页发布者可以使用标准的 robots.txt 指令来指示 Applebot 不要抓取他们的网站,或指示 Apple 不要使用他们的网站内容来训练 Apple 的基础模型。Applebot 不会从那些要求提供登录凭证或受付费墙保护的网站抓取数据。

进一步了解 Applebot 用户代理和 robots.txt 指令

Apple 在训练自身的模型之前会应用过滤器,以移除亵渎性内容和其他质量低下的网站内容。我们会采取措施来降低个人数据被纳入我们模型的可能性,例如忽略来自那些聚合了大量个人数据的网站的数据,并应用过滤器来移除个人身份信息,例如互联网上公开提供的社会安全号和信用卡号。Apple 绝不会尝试通过互联网上公开提供的数据来识别个人身份或创建个人资料。

此外,如果某些 URL 被用于训练 Apple 生成式 AI 功能中的内置模型,且其中包含个人数据(例如,个人博客),Apple 也允许你对此类 URL 的爬取行为提出异议。

要行使这项权利,请访问“Apple Intelligence Privacy Inquiries”(Apple 智能隐私问题问询)表单。

为确保充分审查和评估你的请求,请提供完整且准确的信息,包括含有你个人数据的具体 URL。如果我们有合法依据,诸如当 URL 上的信息涉及其他数据主体的情况,我们可能会拒绝相关请求。

要行使其他与 Applebot 数据有关的隐私权,你可以联系我们

对于侵犯他人权利、无关紧要、无理取闹、极其不切实际或是不合理的请求,我们可能会予以拒绝。

进一步了解 Apple 在隐私方面的做法和政策

发布日期: