主要音声認識アルゴリズムでアフリカ系アメリカ人の認識差があることが判明(データ不足が原因)

米国の研究者チームは、Apple、Amazon、Google、IBM、Microsoftなどの代表的な音声認識アルゴリズムを使って様々な人種による英語での音声認識の認識誤差の実験をおこない、白人とアフリカ系アメリカ人での認識誤差があることを論文として報告した。
音声の誤認識率は白人で19%、アフリカ系でで35%と大きな差があったとのこと。
誤認識率の傾向はすべての音声認識アルゴリズムで共通であったとのこと。

報告によると、人種的格差は主に音声モデルの精度ギャップから生じており、文法的、語彙的特性ではなく、アフリカ系アメリカ人の母国語英語の音韻的、音声的または韻律的特性によって誤認識しているとのこと。この原因として考えられるのは、モデルの学習にアフリカ系アメリカ人の声データが不十分であることと報告されている。

(記者の意見)
アジア人や日本人の英語、外国人が話す日本語などで同じような認識差が出る可能性がある、ということですかね。

RESEARCH ARTICLE Racial disparities in automated speech recognition

この記事が良かったらシェア!