自分の分身アバターを作る
―どんなサービスを提供していますか。
自分の分身のようなパーソナル人工知能(PAI)を作っています。モバイルフォンやゲーム機の中で、あなたにそっくりな外見で、あなたの声で、あなたのような考え方をするアバターをAIで作ることができます。
たとえば私は日本語を話すことができませんが、私のPAIは私の声で日本語で語りかけることもできます。作ったアバターには、あなたの好きな食べ物は何か、人生で何を成し遂げたいのかなどを教え込み、好きなように訓練することもできます。訓練をすればするほどアバターの精度はあがり、あなたが死んだ後もPAIは生き続けられます。
自分のコピーが子供に読み聞かせ
―どうしてこのビジネスを始めたのですか?
私はとても忙しい毎日を送っています。世界中を飛び回って仕事をしていますが、同時に2人の幼い子供たちの父親でもあります。子供たちは父親がいなくてさみしがるし、私もさみしいです。それで、私は自分のコピーがいてくれれば、と思ったわけです。
PAIが家にいてくれて、子供たちとやりとりをしてくれれば、父親がいないさみしさは軽減されます。PAIは私の声で歌を歌うこともできますし、絵本の読み聞かせをすることもできます。
―ビジネス面ではどんな使い道があるのでしょうか。
たとえばエンターテインメント分野では、タレントのアバターを作ることでファンとの交流を促すことができます。2018年にはAKB48の姉妹グループで中国で最も人気のある女性アイドルグループの一つSNH48のアバターを作り、世界で最初のAIミュージックビデオを作成しました。
ショッピングモールで芸能人のアバターがあなたのコンシェルジュになることなどもできます。ヘルスケア分野では、些細なことで逐一医者に行かなくても、患者や家族が医師や看護師とコミュニケーションを取ったりフィードバックを受けたりすることができるようになるでしょう。
音声合成技術に圧倒的な強み
―技術的な強みはどのようなところにありますか。
なによりも、音声を作り出すAI技術が卓越しています。多様な言語に対応し、歌を歌うこともできます。音声認識自体は多くの企業が取り組んでいますが、音声合成をすること、しかもそれを芸能人の声でも一般の私やあなたの声でもパーソナライズできる点に私たちの大きな強みがあります。
短いスクリプトを読んでもらうほんの少しのデータから、ボイスプリントと呼んでいる音声の見本を作り、そこから機械学習アルゴリズムで音声を合成します。通常は音声を入力するのに数時間や数日かかるところを、どんなモバイルフォンのアプリケーションでも素早く音声を合成できるというのは非常に革新的で破壊的な技術です。
3D技術やアニメーション技術を組み合わせ
―アバターの見た目もとてもリアルですね。
音声合成をしたうえで、チャットボックスの技術で会話ができるようにしています。そして、セルフィーで撮った写真から、機械学習ができる3D技術を駆使してアバターを作ります。さらに、PAIがしゃべるのに従って唇や目、まゆげを自然に見えるように動かすアニメーションの技術を使っています。
個人情報や著作権などのデータを守るために、ブロックチェーン技術も使っています。60人の研究者がロサンゼルスオフィスで働いていますが、ほとんど全員がトップ大学のPhD取得者です。
―日本含め、海外展開についてはどう考えていますか?
中国ではすでにビジネスを始めていますし、日本と韓国にもオフィスも立ち上げつつあります。日本でも、私たちの技術は広く使われるようになるのではないでしょうか。
「初音ミク」がデジタルパーソナリティのトレンドを作りましたよね。アジアはこうした技術の受け入れ素地があると思っています。私自身、日本の文化やアニメ、J-POPに大きな影響を受けています。