自宅においてあるスマートスピーカーがウェークアップワードではないにも関わらず起動する現象を経験した方は多いのではないでしょうか?
ルール大学とマックスプランクサイバーセキュリティアンドプライバシー研究所による研究レポートで、音声アシスタントをアクティブにするウェイクワードと音声アシスタントが誤認識する英語、ドイツ語、中国語のフレーズや言葉が1000以上レポートとしてまとめられました。1,000以上もの言葉やフレーズが特定され。
研究者たちは、マイクロソフトのCortana(英語)、ドイツテレコムの音声アシスタント(ドイツ語)、Baidu、Tencent、Xiaomi(いずれも中国語)が作成した音声AI、Siri、Alexa、Google Assistant(いずれも英語)を使ってこのテストを行いました。
実験はスマートスピーカーをテレビやニュース放送、録音されたスピーチの前に配置して行われ、ウェークワードではない音声アシスタントを目覚めさせたすべての言葉やフレーズを一つ一つ特定していったとのことです。
例えば、以下のようなウェークアップワードに近い発音のものが多く含まれます。
Alexa: “unacceptable,” “election” and “a letter”
Google Home: “OK, cool,” and “OK, who is reading”
Siri: “a city” and “hey jerry”
Microsoft Cortana: “Montana”
誤認識起動によるセキュリティリスク
Voicebot.aiの調査レポートによると、誤認識がどのくらいの頻度で発生するかは不明だが、音声アシスタントユーザーの3分の2がこのようなウェークアップワードの誤認識によるデバイスの起動を経験していると回答しています。
欧州やアメリカでは、Googleアシスタントがユーザーの同意なしに会話を録音したこと、Googleが業務委託先の第三者企業にそれらの録音された会話のスニペット(断片)を提供していた訴訟が今も係争中で、研究レポートではこれらの誤認識による音声アシスタントの起動で、デバイスが音声をクラウドに送信されてしまうプライバシーのリスクが指摘されています。
デバイスの誤認識起動を検知するデバイスが発明された
また、ドイツのダルムシュタット工科大学、アメリカのノースカロライナ州立大学とフランスのパリ・サクレー大学の研究者たちが、音声アシスタント機器を定期的に監視し、隠れた音声の録音と送信を識別 → 潜在的に脆弱な部分を検知するプラットフォームLeakyPickを開発したと発表しました。
デバイス挙動の検知は、実際のウェークワードと比較して、音素辞書内の全ての類似する音素を持つ単語を使用すしておいこなわれるそうです。
LeakyPickの研究グループは Echo Dot や Google Home などの代表的音声アシスタントデバイスを使ってLeakyPickでのテストを行いました。そのなかのひとつ、Alexa の起動フレーズを使った実験では、89 の単語で確実に反応し、その一部は起動フレーズの音素とはかなり異なる、「alachah」「lechner」「electrotelegraphic」なども含まれていました。