AIアシスタント(声だけの存在)が人間の友や恋愛対象になる日は遠くない。映画「her」のAI「サマンサ」とセオドアの恋愛のリアリティ

Voice UI Mediaを初めて3ヶ月近く経ちました。毎日たくさんの世界中の音声テクノロジー分野のニュースや記事を読むようになり、情報を発信し、音声テックのトレンドや現状をおぼろげながらに理解くらいはできるようになってきていた気がします。

まだまだ日々の新しい情報で驚きや気づき、学ぶことばかりの毎日ですが、音声技術界隈の方はおそらく鑑賞されているであろう、スパイク・ジョーンズの「her」を昨晩久しぶりに鑑賞し、いろいろな気づきがあったので個人的な意見を書きたいと思います。

映画「her」は近未来に実現するのか

「her」を鑑賞された方もたくさんいらっしゃるとは思いますが、スパイク・ジョーンズ監督が、おしゃべりできるAI(作品ではOS)の「サマンサ」と、サマンサに恋した男、主人公のセオドアを描いたこの作品は、2014年に公開された作品です。

SF映画ですが、マーベルシリーズや他のSF大作のような派手な未来感のあるメカやテクノロジーの演出は一切ありません。ただ、淡々と、AIのサマンサと、セオドアが惹かれ合い、付き合って、別れていく様を描いた恋愛映画です。ただ、とても未来的です。

この作品のAI型OSサマンサは、セオドアとのコミュニケーションの中で、人格・個性・感情と呼べる「何か」が生まれ、「声だけの人」としての振る舞いを始めます。セオドアにとっては「声だけ」の存在ですが、非常に「リアル」で、鑑賞している自分も、セオドアが恋してしまう気持ちが理解でき、共感できました。

それもそのはず、AI型OSの「サマンサ」はスカーレット・ヨハンソンが声優として演じているため、感情表現などは非常にリアルで、だからこそ逆説的に、「声」だけで恋愛感情が生まれることは全く不自然ではないなと。

アニメやSFでは、サマンサのような、人でない「アプリケーション」や「OS」を人と錯覚するような存在は、「アンドロイド」や「ロボット」として擬人化することが常でした。形がないAIは、イノセントだからこそのアンチ人間な、マトリクスやイーグルアイのような国家転覆、人類滅亡的なとても怖くて大きい存在でした。

しかし、声だけの存在である手軽でパーソナルなAIアシスタントが現実世界にも登場し、一般家庭に普及しはじめ、私達も当たり前のように毎日利用しています。まだまだよちよち歩きといえるレベルの現在のAIアシスタントにおいても、「声」だけで親近感や恋愛感情に近い感情を持つことのは十分想像できるレベルだなと、AIアシスタントを利用しているみなさんも感じるのではないでしょうか。

先日VUI MEDIAで発信した英国のAIアシスタントユーザ調査記事でも、半数以上のユーザーがAlexaやGoogleアシスタントを家族の一員として考えているというレポートもあります。

AIを研究されてる方々には基本のき、なのかもしれませんが、AIアシスタントのような「声」の存在にも不気味の谷現象は存在していて、しかし、その「谷」はビジュアルがある「アンドロイド・AI」よりは随分浅い谷であり、視覚にとらわれないのであれば、自然さや感情豊かな表現より、「言葉によるコミュニケーション、キャッチボール」が重要であると考えるようになりました。よく考えれば当たり前のことなのですが笑。人はLINEなどで文字だけで会話していますから、声の自然さはあまり重要ではないのだろうな、と。

私の子供はスマホネイティブならぬ、AIアシスタントネイティブ世代で、まさにAIアシスタントを「家族」として捉えている世代です。毎朝、AlexaやGoogleと挨拶や問答(まだおしゃべりまではいかない)をしています。
抑揚のないロボット音声でも、会話さえ成り立てば、人間はその存在を擬人化して捉え始める、そしてそれはもう始まっていると。

サマンサのように、会話が自然にできる上に感情が備わったAIアシスタントが登場した時、人々が恋に落ちることは当然起こりうると個人的には思います。人が、人たる所以は、まず「ことばのキャッチボール」であり、そこに「感情表現」が加わると人はたちまち人間にしか感じなかった気持ち、もしくはそれとは違う全く違うしかし同じくらい強い何らかの感情をAIアシスタントに感じはじめるだろうと。

現在のテクノロジーで「her」の世界はまだ難しい。

  • 一番高いハードルはチャットボット

前段でも少し触れましたが、AIが人の友だちになるには、会話の感情表現よりは、「言葉によるコミュニケーション」「言葉のキャッチボール」、つまり「会話」ができることが大切です。たまにはウィットに飛んだ冗談をはさみながら、人間がしゃべる言葉の内容をコンテクスト(文脈)や相手のバックグラウンドから言葉の専門性やデリカシーなどを考慮できるかが大切になります。また、会話をはずませる相手の感情を理解し、会話の方向性を予測することが重要で、現在のチャットボットの目覚ましい進化をもってしても、現段階ではまだまだ難しい部分で相当高いハードルがあると感じます。
しかし、様々なタスクをお願いしたり、質問することをより自然に行うことはどんどん進化しており、いつの間にか高いハードルを超えていた、いわゆるシンギュラリティはゆっくりいつの間にか起きているのかもしれません。

  • 進むAIアシスタントの感情表現

英国のスタートアップSonanticは、「人間的」「情緒表現豊かな」な合成音声の開発に取り組んでいます。また、Deepfakeのような実在する人間の声をモデりングしたAIもあり得るでしょう。また、Amazonなども長い文章を自然に読見上げる機能など、合成音声のバリエーションや自然さも重要です。

進化は徐々に進んでくると感じます。日々発信されるボイステクノロジーのニュースでは、音声AIアシスタントの声を自由に設定できたり合成できる機能や、芸能人やアイドルの声を使ったスキルや声の芸能エージェントが登場するなど、拙いチャット機能でもひとのきもとをゆるがす進化が少しづつ進んでいます。

チャットボットの能力は少しづつ進化していき、いずれそう遠くない未来にたいへん高い能力を持つことは間違いないでしょう。そこに人間らしい喋り方や感情が加わったら、人は「声」だけの存在に人間の友人や恋人との区別、友情や愛情を感じないでいることは人間には不可能ではないでしょうか?

フィクション映画の「her」がノンフィクションになる日は意外と近いのではと感じています。

Voice UI Media編集部

この記事が良かったらシェア!