アドバンスト・メディア、医療・製薬・金融特化の音声認識APIを追加公開

アドバンスト・メディアは、4月2日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデート、汎用エンジンに加え、「医療汎用エンジン」「業務報告 製薬エンジン」「業務報告 金融エンジン」の3つの領域特化型音声認識APIを提供開始したと発表

AmiVoice Cloud Platfom WEBサイト

AmiVoice 音声認識APIを使えば、クライアントアプリケーションに特別なライブラリを組み込む事なく、音声認識機能を実装でるとのこと。音声文字化や音声対話、音声制御、音声翻訳等、アプリケーション、Webサイトなどで利用が可能だ。

AmiVoice 音声認識APIの特徴

①リアルタイム処理、バッチ処理、音声データのログ保存の選択が可能
リアルタイム認識、バッチ認識の双方に対応。シーンや運用に合わせて、音声データのログ保存の有無を選べる為、運用セキュリティや社内規定に準じた音声認識の開発が可能。

②お支払いは発話区間のみ。1秒単位で計算
利用料は、発話時間のみにかかる。秒あたりの単価で計算しており、音声がある部分だけを自動的に切り出す為、無音やノイズ等、人の声がない区間は料金がかからない。

③ビジネスユース向けの言語フィルタリングを搭載
ビジネスで使用する事のない不適切な用語や有害な用語を省いた、ビジネスユースに強い言語モデルを使用。不要語を省く事で誤認識を軽減。

④ユーザー自身が精度向上を図れるカスタマイズ単語登録を搭載
製品名・固有名詞等、単語のカスタマイズ登録が可能。単語登録によって、専門用語や氏名等もスムーズに変換し、更に認識率を向上させる事ができる。

⑤音声認識APIをすぐに体験・開発できるサンプルプログラムを用意
音声認識APIをすぐに体験できるサンプルプログラムがダウンロードできる。各サンプルプログラムには、音声ライブラリが含まれており、実際のアプリ開発時に利用する事ができる。

また、認識方法は、リアルタイム認識(WebSocket 音声認識API)、バッチ認識(HTTP 音声認識API)となる。

プレスリリース本文

この記事が良かったらシェア!