映像から超微細な振動を読み取って、映像から音を復元できる。人の心の動きも読めてしまう?嘘のような驚きの技術。

VOICE UI MEDIAは、その名のとおり『声』に関する技術を取り上げるメディアですが、技術の可能性として、ひとつ面白い技術をご紹介したいとおもいます(感想やご意見も絶賛募集中です笑)。

私は顔認識・画像認識AIのプロジェクトにもいくつか参加しておりいろいろな技術に触れる機会をいただくのですが、数秒の映像から人の感情を推定検知する技術がすでに存在しています。その精度は90%以上。初めてみた時、映画『マイノリティ・リポート』を思い出したことを覚えています。
メンタリストのダイゴさんは人の表情や動きの癖を見ることで驚異的な読心術を披露されていましたが、コンピュータアイにはダイゴさんもびっくりの、人の目には見えない感情や筋肉、体液のの動きを推定検知することができるのです。どんなポーカーフェイスにもごまかされません。

これは、『人の目には見えない超微細な動き』を映像処理によって『人の目にも見える大きな動き』に変換することで、『感情』や『音』などが映像から文字通り『見える』ようになる技術です(”motion microscope“と呼ばれる技術)。

同じ原理を応用すると、音のない映像から、映像に写っている対象物が音が発する『音波』によって振動する微細な動きを検知することで、音なき映像から『音』を復元することが可能になります。

下のTEDのビデオはその原理を説明しているビデオです。(5分50秒くらいから)

原理的には理解できるのですが、このビデオを観て驚かない人は少ないのではないでしょうか?

コンピュータが我々人類に新たな『耳』と『目』をもたらし、これまで見えていなかった心や音が見える世の中がもう実現しています。

この記事が良かったらシェア!