Siri のプライバシー保護とグレーディングについて

   

Apple が Siri の品質を評価するプロセスの一環として、Siri で録音された音声を人が聴いているという最近の報道にお客様が懸念を抱いておられることを承知しております。Apple はお客様のご心配の声を耳にし、Siri へのリクエストを人間が聴くグレーディングをすぐに停止し、これまでのやり方と方針を徹底的に見直す作業に入りました。その結果、Siri にいくつかの変更を加えることが決定されました。変更点を反映したソフトウェアアップデートは、今年の秋にリリースされる予定です。この変更について、詳しくは Apple Newsroom の記事を参照してください。

この記事に加えて、ここでは Sir のプライバシーとグレーディングに関してよく寄せられるご質問についてお答えします。
 

グレーディングとは?

グレーディングを停止する前は、Siri に頼みごとをした音声の小さなサンプル (0.2%未満) とコンピュータが生成した書き起こしを見直して、Siri がどれだけうまく答えているかを計測し、Siri の信頼性を向上させていました。たとえば、ユーザは Siri を起こすつもりだったか。Siri はリクエストを正確に聞き取ったか。そして Siri はリクエストに適切に反応したかなどが検討されました。Apple では、Siri を利用しておられる世界中のお客様に最高の体験をお届けするため、長い時間をかけて Siri へのリクエストから少量のサンプルを集めてグレーディングすることで、大きな改善を行うことが可能になっています。
 

Siri のプライバシーポリシーは、数ある AI アシスタントの中でどのようにユニークな内容となっていますか?

Apple は、プライバシーは基本的人権であると考えています。製品はユーザの個人情報を守るように設計しており、常に保護機能の強化に努めています。これは Apple が提供するサービスについても当てはまります。

Siri で私たちが目指しているのは、お客様のプライバシーを用心深く保護しながら、最高の利用体験を提供することです。私たちは、音声の録音に関してお客様がデバイスの設定を変更しなくても、初期設定の状態でプライバシーが保護されているべきだと考えています。Apple では、Siri の改善のために音声を提供するには、お客様ご自身でそう選択することが必要になります。

Siri は、最初からユーザのプライバシーを守るように設計されています。それは、Apple のビジネスモデルが個人情報の収集に依存していないためです。私たちはできるだけ少ない量のデータで優れたサービスを提供するように努め、Siri へのリクエストも含め、データは可能な限りデバイス上で処理するようにしています。

Siri はデータの処理中に各データを追跡できるようにランダムな識別子を用います。これは 1 つのデバイスに紐づけられた長い文字と数字の列です。お客様の Apple ID や電話番号を使ってお客様を識別することはありません。このやり方は今日使われているデジタルアシスタントの中でもユニークなものであると信じています。また、保護をさらに強固なものにするため、6 か月を経過したデータはランダムな識別子から切り離されます。

iOS では、Siri がアクセスするデータの詳細や、Apple がプロセスの中でお客様の情報をどのように保護しているかを「設定」>「Siri と検索」>「”Siri に頼む” とプライバシーについて」で確認できるようになっています。
 

Siri はいつも音声を聞き取っているのですか?「Hey Siri」と言っていないときは Siri が音声を聞き取れないようにするにはどうすればよいのですか?

いいえ、聞き取っていません。Siri は、「Hey Siri」という声にデバイスが反応した後ではじめて起動し、音声を Apple に送信するようになっています。腕を上げて Siri を起動する Apple Watch の「Raise to Speak」機能や、iPhone、iPad、Mac、Apple TV、AirPods、および HomePod で指定のボタンを使って Siri を起動する場合も同じです。

「Hey Siri」という声を認識する際も、音声はデバイス上で処理され、複数の段階に分けて解析されて「Hey Siri」というパターンと一致するかどうか判定されます。お客様の音声がサーバに送信されるのは、デバイスが「Hey Siri」という声のパターンを認識したときのみです。さらに、サーバでは追加の処理としてリクエスト全体を解析し、Siri に向けられたものであることを確認します。

それでも、意図していないのに Siri が誤って起動してしまうことがあります (Apple ではこういった現象を「誤トリガ」と呼んでいます)。Apple では誤って起動することを最小限に抑えるように努めており、そうした場合の音声をグレーディングの担当者が聞くことができるだけないように、レビューのプロセスを改定しました。グレーディングを再開した際には、Siri が意図せず起動したと判定された録音は担当チームが削除することになります。


レビュー担当者がアクセスできるデータの量を最小限に抑えるとはどういう意味ですか?それでも聞くことができる内容とはどういったものですか?

Apple では、データのレビュー担当者がアクセスできるデータの量を最小限に抑えるように、グレーディングのプロセスを改定中です。それにより、担当者は作業を効果的に行うために必要なデータしか見られなくなります。たとえば、ホーム App で設定したデバイスと部屋の名前は、家の中のデバイスをコントロールするリクエストを評価している場合にのみアクセスできるようになります。


Siri が、連絡先や、個人のプレイリストの名前、ホーム App で設定した部屋やデバイスの名前などのユーザ情報にアクセスする必要はありますか?Apple は個人を特定したり、HomeKit デバイスをコントロールしたりできるのですか?

Siri が個人に特化したタスクをより正確に遂行できるように、Siri は特定の情報をお客様のデバイスから集めて保存します。たとえば、Siri が珍しい名前に遭遇すると、その名前を正しく認識できているかどうかを確かめるためにお客様の連絡先にある名前を参照することがあります。iOS では、Siri がアクセスするデータの詳細、それにプロセスの中で Apple がどのようにお客様の情報を守るかを、「設定」>「Siri と検索」>「”Siri に頼む” とプライバシーについて」で確認できるようになっています。

Siri は、できるだけ少ない量のデータで正確なサービスを提供します。たとえば、スポーツのイベントについて質問したとしましょう。Siri は適切な情報を提供するために、現在お客様がいる場所のおおまかな位置情報を使います。しかし、一番近い食料品店をたずねた場合は、もっと具体的な位置情報が使われます。

Siri に未読のメッセージを読むように頼んだ場合、Siri は未読のメッセージを読み上げることだけをデバイスに指示します。メッセージの内容は、リクエストの実行に必要ないので Siri のサーバには転送されません。


誰がグレーディングを行うのですか?

お客様が情報を提供すると選択された場合、Siri とのやり取りの音声サンプルを聞くことができるのは Apple の社員のみです。Siri を間違って起動したと判定された録音は、担当チームが削除することになります。


情報を提供すると選択していない人の書き起こしデータまで保存しておくのはなぜですか?

コンピュータが生成した書き起こしデータは Siri の改善と信頼性の向上のために使用されます。この書き起こしは機械学習のトレーニングに使われ、Siri の改善、一般的な利用パターンの把握、言語と理解のモデルの更新に役立てられます。書き起こしデータは Siri の信頼性に関わる重大な問題の解決にも利用されます。


Siri が音声の録音と書き起こしデータを保持しないようにするには、Siri を無効にすることしか方法はありませんか?

初期設定としては、2019 年の秋にリリースされるソフトウェアアップデート以降、Apple は Siri へのリクエストの録音を保持しなくなります。一方、音声によるリクエストをコンピュータが書き起こしたデータは、今後も Siri の改善のために利用されることがあります。コンピュータが書き起こしたデータは、お客様の Apple ID ではなくランダムな識別子に関連付けられます。また、この識別子が保持されるのは最長 6 か月です。Siri の録音の書き起こしを保持されたくない場合は、「設定」の「Siri と音声入力」を無効にしてください。

 

公開日: