オーストラリア連邦科学産業研究機構が音声スプーフィング攻撃を防ぐ、音声活性検出技術を開発

CSIRO(オーストラリア連邦科学産業研究機構)のデジタルスペシャリスト部門であるResearchers Data61は、消費者を音声スプーフィング攻撃(不正なデータを用いることにより、攻撃者や攻撃用プログラムを別の人物やプログラムに見せかける事を利用した攻撃)から保護するための新しいテクノロジーを開発したと公表。

音声スプーフィング攻撃を行う犯罪者やハッカーは、Amazon AlexaやGoogleアシスタントなどの音声アシスタントの人の声を録音し、それを再生してその人になりすましたり、サンプルをつなぎ合わせて第三者のなりすましたり、声を模倣する。

Void(音声活性検出)と呼ばれる新しいソリューションは、スマートフォンまたは音声アシスタントソフトウェアに内包することができ、人間の生の声とスピーカーから再生された声のスペクトルパワーの違いを特定することでハッキングを検出するという。

CSIROのData61のサイバーセキュリティ研究サイエンティストであり、研究論文の筆頭著者であるMuhammad Ejaz Ahmed氏は、音声技術が日常生活の一部となるにつれて、プライバシー保護技術は消費者のプライバシーとセキュリティにおいてますます重要になっていると話す。
「音声スプーフィングは被害者の声を録音するだけなので、実行するのが最も簡単な攻撃の1つとして知られていますが、録音された音声であることの検出が非常に困難です。Voidは、それらを検出し、人々の音声コマンドのセキュリティに役立つ、より効率的で正確な検出を可能にする革新的なテクノロジーです。」

通常、ディープラーニングモデルを使用する既存の音声スプーフィング技術とは異なり、Voidはスペクトログラムからの洞察に基づいて設計された。これは、信号の周波数のスペクトルを視覚的に表したもので、時間の経過とともに変化して音声の「活気」を検出する。

この手法は非常に正確な認証を実現し、ディープラーニング手法より8倍速く攻撃を検出し、153分の1のメモリしか使用しないため、スマートデバイスに組み込むことができる実行可能で軽量なソリューションであるとのこと。

Voidは、サムスンのデータセットと話者自動検証のなりすまし対策テストケースを使用してテストされており、各データセットの精度は99%と94%に達している。

ソース記事

この記事が良かったらシェア!