話しかけるだけで音声を認識してさまざまなタスクを処理してくれるAIアシスタントは便利な反面、話しかけたデータがメーカーの社員に聞かれていたり、無関係な第三者に流出したりと、プライバシーが心配になる側面もあります。そんなAIアシスタントの代表的なメーカー5社が音声データをどう扱っているのか実際に各社に確認してみた結果を、IT関連メディアVentureBeatがまとめています。

How Amazon, Apple, Google, Microsoft, and Samsung treat your voice data | VentureBeat
https://venturebeat.com/2019/04/15/how-amazon-apple-google-microsoft-and-samsung-treat-your-voice-data/

比較の対象となった音声アシスタントは、Amazonの「Alexa」、Appleの「Siri」、Googleの「Google アシスタント」、Microsoftの「Cortana」、サムスンの「Bixby」です。

◆Alexa(Amazon)
Amazonは音声認識の精度や自然言語理解システムの品質を向上させるため、音声データのうち「ごく一部のサンプル」を抽出して分類していると回答しました。サンプルはサードパーティー企業が使用しますが、悪用を防ぐためにAmazonは「技術的および運用上の厳格な保護」を講じており、サードパーティー企業の従業員による顧客の識別情報へのアクセスは制限されています。ただし、アカウント番号・ファーストネーム・デバイスのシリアル番号にはアクセスできるとのこと。

Amazonの広報担当者は、「すべてのデータはアクセス制限やサービスの暗号化によって機密情報として処理され、情報の管理体制は厳しい監査の元に置かれています」と話しています。また、ユーザーはブラウザやアプリの設定で音声データの使用を無効化することも可能になっています。


◆Siri(Apple)
AppleはSiriが録音した情報の取り扱いについてまとめたものを、自社サイト上で公開しており、「あなたの名前、連絡先、あなたが聴く曲、検索内容といった特定の情報が、暗号化されたプロトコルを使ってAppleのサーバーに送られます」と記載されています。また、音声情報はApple IDではなく、15分ごとに自動的に更新されるランダムな識別子に紐付いていて、ユーザー情報とは直接関連付けされていないとのこと。Appleのサーバーに保存された音声情報は、識別子に紐付いた状態で半年間Siriの認識システムで分析され、識別子を削除した状態でさらに2年間Siriの改良に利用されます。

AppleもSiriの録音を無効化できるようにしているほか、音声ではなく文字入力でSiriを利用できる「Siriにタイプ入力」という設定項目も用意されています。ただし、いずれの場合でも識別子なしの音声情報、通信記録、および関連データの「小さなサブセット」は2年以上Appleが保有する場合があるとのことです。


◆Google アシスタント
Googleの広報担当者はVentureBeatの問い合わせに対し「音声認識システムを改善するためのデータの送受信はごく限定的で、ユーザーのプライバシーを保護するためにあらゆるテクノロジーを駆使しています」と回答しました。音声データは個人が特定できるような情報とは結びついておらず、また一連の処理はほぼ自動化されているので、Googleの従業員は処理に関与していないとのこと。ごくまれにサードパーティー企業に提供する際は、ほとんどのケースで音声データではなくテキストデータに変換しているとのことです。

Googleは人間が関与しなくてもGoogle アシスタントを改良できるよう、技術開発を進めていく方針です。例えばテキストから音声を合成する「Text to Speech」では、サンプリングした音声を使用しなくても音声を合成できる「Tacotron 2」システムを開発しました。

Google アシスタントもAmazonやAppleと同様に音声データを無効化することが可能です。それでも、スパムの防止とサービス向上のために関連情報がGoogleに保有されることはあるということです。


◆Cortana(Microsoft)
MicrosoftもCortanaに関するプライバシー保護の概要を説明したサポートページをサイト上に公開しています。サポートページでは「Windowsでは、サインインしていない場合や、個人用のCortanaデータの利用をCortanaに許可していない場合でも(中略)Cortanaはこの処理を行うために、入力または読み上げられた内容をBingサービスに送信します」と記載されています。また、音声認識の精度を向上させるため、ユーザーの音声データを利用しているとも明記されています。

MicrosoftでもCortanaを文字入力で使用したり、音声データを管理して無効化したりすることが可能です。


◆Bixby(サムスン)
サムスンはVentureBeatの問い合わせに応じなかったとのことですが、BixbyのサポートページのFAQに音声データの収集・使用方法について説明があります。これによると、サムスンは音声入力のデータ・使用デバイスの構成と設定・IPアドレス・デバイス識別子などを使用してBixbyの改善に役立てているとのこと。

サムスンのプライバシーポリシーによると、この「改善」とは音声データをテキストに変換するサービスを提供する非公開のサードパーティー企業が関与しているとのこと。また、サムスンは音声データの保存期間も明確にしていません。

BixbyはGalaxyシリーズのBixby Homeアプリとして提供されていて、アプリの設定から無効化することが可能です。

Photo by Gerd Altmann