SNS上でモバイルゲームプラットフォームを開発しているスタートアップのArtieは、音声認識システムが言葉のアクセント、年齢や性別によって発生するバイアスを検出する”Artie Bias Corpus(ABC)”というツールをリリースしたとコーポレートブログで発表しました。
音声認識は、ノンネイティブの発音や方言、子どもや老人、男女の差による認識精度は現在においても高いとは言えない状況です。以前Voice UI Mediaでも取り上げたように、様々な調査でも認識差があるとの報告がなされています。
Artie Bias Corpusは(※コーパス・・・テキストや発話を大規模に集めてデータベース化した言語資料)、3つの性別クラス、8つの年齢層(18歳から80歳まで)、17種類の英語のアクセントをもっています。第3者によって選別された質の良い2.4時間の音声データと文字起こしデータに加えて、それらの話者に関するオプトイン人口統計データで構成されています。
詳しくはこちらから。
Artieが音声認識システムの言葉のアクセントや性別や年齢による認識バイアスを測定するツールを発表
