Конфиденциальность и калибровка работы Siri

   

Мы знаем, что пользователи озабочены недавними сообщениями о том, что аудиозаписи Siri прослушиваются в ходе оценки качества работы Siri. Как только мы узнали об опасениях пользователей, мы сразу приостановили ручную калибровку запросов Siri и начали тщательный анализ наших правил и политик использования данных. В результате мы решили внести ряд изменений в работу Siri, которые будут реализованы в следующем обновлении программного обеспечения этой осенью. Подробнее об этих изменениях см. в этой публикации Apple Newsroom.

В дополнение здесь приведены некоторые ответы на распространенные вопросы о конфиденциальности и калибровке работы Siri.
 

Что такое калибровка?

До того как мы приостановили калибровку, она затрагивала небольшую часть (менее 0,2%) аудиозаписей запросов Siri и их автоматических расшифровок. Калибровка помогала измерить точность ответов Siri и повысить их качество. Например, действительно ли пользователь хотел вызвать Siri? Насколько точно был распознан запрос? Соответствовал ли ответ Siri произнесенному запросу? Со временем, применяя калибровку к небольшому количеству запросов Siri, компания Apple сможет вносить серьезные улучшения, чтобы наши пользователи по всему миру оставались довольны работой Siri.
 

Насколько политика конфиденциальности Siri отличается от правил использования других интеллектуальных помощников? 

В компании Apple конфиденциальность считается основополагающим правом человека. Мы создаем все свои продукты с заботой о личных данных пользователей и постоянно совершенствуем свои системы защиты. Это также относится и к нашим службам.

Создавая Siri, мы стремились максимально повысить удобство пользователей без ущерба для конфиденциальности. Мы считаем, что право пользователей на конфиденциальность в отношении их аудиозаписей должно соблюдаться по умолчанию без необходимости лично вносить какие-либо изменения в настройки устройства. Согласно политике Apple пользователи должны сначала согласиться предоставить доступ к своему аудио, чтобы улучшить работу Siri.

Технология Siri с самого начала разрабатывалась с заботой о защите данных пользователей, поскольку мы не зарабатываем на сборе личных данных. Работа Siri максимально локализована на устройстве, поэтому Siri собирает минимально необходимое количество данных, в том числе запросы Siri, чтобы предоставлять нашим пользователям качественное обслуживание.

Чтобы отслеживать ваши данные во время их обработки, Siri использует случайный идентификатор, представляющий собой длинный буквенно-цифровой ряд, который связан с одним устройством: ваши данные никак не привязываются к вам лично через ваш Apple ID или номер телефона. Насколько нам известно, Siri является единственным виртуальным помощником с таким алгоритмом работы. Для дальнейшего повышения надежности ваши данные отвязываются от случайного идентификатора вашего устройства через 6 месяцев.

В iOS вы всегда можете узнать, к каким данным Siri имеет доступ и как при этом обеспечивается их защита: просто откройте меню «Настройки» > «Siri и Поиск» > «О "Спросите Siri" и конфиденциальности».
 

Siri слушает все, что я произношу? Слушает ли Siri меня, если не было произнесено «Привет, Siri»? 

Нет. Siri начинает работать и отправляет аудио в компанию Apple только после того, как вы активируете свое устройство, сказав «Привет, Siri», использовав функцию «Поднести и говорить» на Apple Watch или вызвав Siri специально назначенными кнопками на iPhone, iPad, Mac, Apple Watch, Apple TV, AirPods и HomePod.

Для распознавания команды «Привет, Siri» аудио обрабатывается исключительно на устройстве, проходя через несколько этапов анализа. Это позволяет определить, соответствует ли аудио шаблону «Привет, Siri». Только когда устройство распознает шаблон «Привет, Siri», ваше аудио отправляется на сервер. На сервере мы предпринимаем дополнительные меры, чтобы проанализировать весь запрос и подтвердить, что он предназначался Siri.

Иногда происходит так называемое «ложное срабатывание», когда Siri активируется без вашего намерения. Мы прилагаем все усилия, чтобы минимизировать количество ложных срабатываний, и усовершенствовали процедуру оценки, чтобы ограничить к ним доступ для калибровщиков. Когда мы возобновим программу калибровки, наша команда будет удалять любые записи, которые случайно вызывали Siri.


Когда вы заявляете, что минимизируете количество данных, к которым имеют доступ оценщики, что это значит? Какие аудио они еще смогут прослушивать?

Мы вносим изменения в процесс ручной калибровки, чтобы еще больше минимизировать количество данных, к которым получают доступ оценщики. Поэтому последние смогут видеть только те сведения, которые позволят им лучше выполнять свою работу. Например, имена устройств и названия комнат, которые вы указываете в программе «Домой», станут доступны оценщику, только если запрос связан с управлением устройствами в доме.


Почему Siri запрашивает доступ к такой информации пользователя, как контакты, названия персональных плейлистов и комнат, имена устройств, указанных в программе «Домой»? Может ли Apple идентифицировать меня или управлять моими устройствами HomeKit?

Чтобы точнее выполнять ваши индивидуальные запросы, Siri собирает и хранит определенную информацию о вашем устройстве. Например, когда Siri слышит редкое имя, для его точного распознавания может использоваться список имен из ваших контактов. В iOS вы всегда можете узнать, к каким данным Siri имеет доступ и как при этом обеспечивается защита данных: просто откройте меню «Настройки» > «Siri и Поиск» > «О "Спросите Siri" и конфиденциальности».

Siri использует только те данные, которые необходимы для точных результатов. Когда вы задаете вопрос о спортивных событиях, Siri использует общие сведения о вашей геопозиции, чтобы отобразить подходящие результаты. А когда вы спрашиваете, где ближайший продуктовый магазин, Siri использует более точную геопозицию.

Если вы просите Siri зачитать вслух ваши непрочитанные сообщения, Siri просто отправляет вашему устройству команду сделать это. Содержимое ваших сообщений не передается на серверы Siri, поскольку это не требуется для выполнения вашего запроса.


Кто выполняет калибровку? 

Если пользователь согласится участвовать в программе, аудиозаписи его взаимодействий с Siri будут доступны только сотрудникам Apple. Наша команда будет удалять любые записи, которые случайно вызывали Siri.


Почему вы храните расшифровки для пользователей, которые отказались от участия в программе?

Автоматические расшифровки используются для улучшения работы и точности ответов Siri. Иногда Apple использует эти данные в процессе машинного обучения для улучшения работы Siri, определения общих моделей использования, а также для обновления моделей языка и понимания. Расшифровки также могут использоваться для решения важных проблем, которые влияют на точность работы Siri.


Единственный способ не сохранять мои аудиозаписи и расшифровки — это отключить Siri?

По умолчанию Apple перестанет сохранять аудиозапросы Siri уже в следующей версии программного обеспечения, которая станет доступна осенью 2019 года. Автоматические расшифровки ваших аудиозапросов могут быть использованы с целью улучшения работы Siri. Эти расшифровки будут оставаться привязаны на протяжении 6 месяцев к случайному идентификатору, но не к вашему Apple ID. Если вы не хотите, чтобы расшифровки ваших аудиозаписей Siri сохранялись, можно отключить Siri и функцию «Диктовка» в меню «Настройки».

 

Дата публикации: