「人間と遜色ない会話ができる」ビジネス用音声アシスタントを開発するPolyAI。イギリス・ロンドンに本社を構える同社はAIを用いて、100以上の言語に対応し、人間同士の自然な会話のように返答できるサービスを開発している。ケンブリッジ大学で機械学習・自然言語処理の博士号を取得し、Apple社でもリサーチャーとして勤務した経験を持つ、音声認識界のエキスパートである同社の共同創業者でCEOのNikola Mrkšić氏に話を聞いた。

利用シーンが拡大する音声アシスタントの「革命児」

――御社はどんなサービスを展開しているのでしょうか。

 PolyAIは、AIを用いた自動音声アシスタントによる、電話応対サービスを展開しています。英語や日本語をはじめ、100以上の言語に対応していて、ホテル業界などのサービス産業や飲食店などの外食業界での電話予約時、金融機関のサービスに関する質問受付のためのコールセンターなどさまざまな場面で使用されています。

 PolyAIの特長は、当社がUniversity of Cambridgeで開発したAIにより、「人間と遜色ない会話」を展開できる点にあります。あらゆる言語、あらゆる訛りを理解するほか、会話のパターンに応じて人間のようにスムーズな返答を、会話の始まりから終わりまで展開できるのです。

Nikola Mrkšić
PolyAI
Co-Founder & CEO
University of Cambridgeにて博士号を取得 ( 機械学習 / 自然言語処理) 。自己学習対話APIを開発したスタートアップVocalIQ (Apple買収) で勤務後、Appleで機械学習リサーチャーを務める。2017年、PolyAIを共同設立しCEOに就任。

 現在、多くの企業が人材不足とコスト削減の観点から、自動音声アシスタントを開発・強化しています。これは、コロナ禍であらゆる産業のDXが進み、人の手を必要としない顧客向けサービスのニーズが高まっているためです。特に、アメリカのサービス産業やコールセンターでは、メールなどの文章よりも、電話をはじめとした音声によるサービスが好まれていることもあり、この分野の進化が期待されているのです。

 しかし、人間の音声の認識の仕方はとても複雑で、自動音声の会話の中の5%が「人間らしくない」と判明すれば、顧客体験の質は著しく低下してしまいます。コールセンターやサービス産業では「顧客満足度」がすべてといっても過言ではありません。その良し悪しが、企業の収益性とダイレクトにつながっているのです。ですから、中途半端な自動音声サービスを導入すると、逆にリスクになってしまう可能性もあるのです。

 そんな中、PolyAIは一聴してもらえれば分かりますが、何十億パターンの会話を用意していて、顧客の発言の要旨を会話の文脈のなかで捉えられます。また、会話の過程で顧客が発した日付や名前、電話番号などの重要な情報も瞬時に取得できるのです。つまりPolyAIは、「人間と話しているような音声をAIが作成する」自動音声業界で革命的なイノベーションを起こしたサービスだと言えるでしょう。

 現在、FedExやMarriottなどのグローバル企業をはじめ、保険会社や銀行などの金融機関、通信、自動車業界、政府機関など、PolyAIはさまざまなセクターで利用されています。使用されるシーンは、例えばホテルのフロント、レセプションでの20秒ほどの会話から、宿泊予約の電話まで、短い時間の会話から一定の長い時間まで対応しています。また、料金体系も固定費は無料で、通話時間による従来課金式であるなど、コスト・パフォーマンスにも優れています。

――人間と遜色ない会話を展開できる、PolyAIの技術的な優位性はどこにあるのでしょうか。

 まず、AIが顧客の発言を聞き、その「意図」を読み取ります。これは、自動音声認識(ASR)を搭載したPolyAI独自の人工知能の自然言語理解(Natural Language Understanding)が、アクセントや背景音、通信の乱れなどを除去し、発言のメイン部分だけを理解することで可能になっています。

 さらに、この人工知能には、TwitterやQuora、RedditといったSNSや映画字幕から何十億もの人間の会話を記録したビッグデータをあらかじめ学習させています。非常に多くのパターンの人間のコミュニケーションを理解させているのです。事前訓練がなされているため、顧客はトレーニングデータを入力する必要がなく、平均してわずか2週間でPolyAIを現場に導入できます。

 当社のビッグデータにはもう一つ利点があります。もし、これまで学習していないタイプの会話が入ってきたとしても、瞬時にそのデータを入力し、次回からの「返答リスト」に記載することが可能です。PolyAIの人工知能は、人間が学習する方法に似ているのです。

日本の金融機関とも協働 形にとらわれないパートナーシップを模索

――既に日本企業の顧客も獲得しているのでしょうか。

 はい。2022年初頭から、日本の金融サービス系の顧客と協働しています。ホテルなどホスピタリティ業界はこれからです。私は、PolyAIが日本で受け入れられる素地は大きいと考えています。日本はデジタル社会ですが、自動チャットと比較すると、音声アシスタントはまだ広がりきっていない市場であることが魅力的です。

 また、日本人は議論よりも、比較的穏やかな会話を好むことも、我々にとっては利点でしょう。感情的なコミュニケーションよりも、要点を把握する会話においては自動音声アシスタントがその威力を発揮するのです。

――日本の大企業との提携を考えた場合、どのような形態のパートナーシップが理想でしょうか。

 代理店契約や共同開発、合弁事業など、さまざまな形態のパートナーシップに対してオープンでいたいと考えています。なぜなら、ヨーロッパやアメリカでは、PolyAIはホテルの予約のような電話応対サービスや、金融機関のバックエンドの応対を外部コールセンターに委託する代わりに当社のサービスを使う場合など、さまざまな場面に対応可能だからです。PolyAIは汎用性の高い音声アシスタントであるため、そのポテンシャルをフルに使える形態のパートナーシップを構築したいと考えています。

――御社は累計6600万ドルの資金調達に成功しています。資金の使い道を教えてください。

 多くのスタートアップのように、既存市場の深耕と、プロダクトの技術開発への投資に資金を充てます。より多くの場面でPolyAIを展開できるようにしていきたいですね。事実、2022年には当社は対前年比で売上高約5倍を記録しているなど、ビジネスは順調です。

PolyAIが考える音声アシスタントの未来

――あらためてですが、ケンブリッジ大学での研究を経て、2017年に創業した経緯について教えてください。

 私はUniversity of Cambirdgeで自然言語分野の博士課程に在籍中、音声認識の分野の第一人者であるSteve Young氏の研究室で研究に取り組み、200以上の論文を出しました。Ph.D取得後は、Young氏が立ち上げたVocalIQ(2015年にAppleに売却)で働くなど、私自身のキャリアを通して音声認識と向き合ってきました。アカデミアやAppleなどの大企業、スタートアップとさまざまな組織で働く中で、確かなビジョンをもった小さな会社で働くのが、自分の性に合っていることに気づいたのです。それが、PolyAIを創業した理由です。

――音声アシスタントの未来は、どのようになっていくとお考えですか?

 多くの企業がさまざまな場面で音声アシスタントを利用するようになり、日常に溶け込んでいくでしょう。ビジネスにおいても、その導入は収益を左右するカギとなるのではないでしょうか。

 ご存じの通り、先進国では人口減社会が定着し、労働力は不足します。企業は顧客体験向上のためには、コールセンターで新人を雇い、人材育成を行うよりも、精度の高いAIによる音声アシスタントを導入する方が良いと考えるようになるでしょう。すでに、情報を集積し、記憶するといったエリアに関してはAIの方が人間よりも優れているからです。

 コールセンターの業務は、顧客の反応を知るという意味でとても重要ですが、業務量が膨大で、多くのリソースが割かれているのが現実です。これを、PolyAIをはじめとしたAI音声アシスタントに置き換えることで、人間は従来よりももっとクリエイティブな仕事に集中できるようになると思います。

――最後に、御社の長期的な目標を教えてください。

 我々の日常の中に確実に溶け込むであろう音声アシスタントを、より愛され、より信頼されるものにしたいですね。仮にみなさんに「今から50年後、音声アシスタントは社会で当たり前のように使われると思いますか?」と質問したとすれば、みなさん「イエス」と答えるでしょう。PolyAIは、「50年後」とは言わずに「5年後」に、音声アシスタントが日常にありふれたものになる光景をつくりたいですね。



RELATED ARTICLES
世界30カ国のエアラインで導入 複雑な運航を「効率的に、安全に」支援するPortside
世界30カ国のエアラインで導入 複雑な運航を「効率的に、安全に」支援するPortside
世界30カ国のエアラインで導入 複雑な運航を「効率的に、安全に」支援するPortsideの詳細を見る
ディープラーニング専用AIコンピュータを開発するCerebras Systems オープンソースのGPTで「民主化」にも
ディープラーニング専用AIコンピュータを開発するCerebras Systems オープンソースのGPTで「民主化」にも
ディープラーニング専用AIコンピュータを開発するCerebras Systems オープンソースのGPTで「民主化」にもの詳細を見る
AIで「がんの見逃し」を防ぐ 先進の内視鏡画像診断支援 AIメディカルサービス
AIで「がんの見逃し」を防ぐ 先進の内視鏡画像診断支援 AIメディカルサービス
AIで「がんの見逃し」を防ぐ 先進の内視鏡画像診断支援 AIメディカルサービスの詳細を見る
脱炭素社会の実現に向けて  ZETピッチ登壇企業紹介 日本スタートアップ #2
脱炭素社会の実現に向けて  ZETピッチ登壇企業紹介 日本スタートアップ #2
脱炭素社会の実現に向けて  ZETピッチ登壇企業紹介 日本スタートアップ #2の詳細を見る
AIを駆使し契約に潜む様々なリスクをチェック 企業法務の課題解決を強力にサポート LegalOn Technologies
AIを駆使し契約に潜む様々なリスクをチェック 企業法務の課題解決を強力にサポート LegalOn Technologies
AIを駆使し契約に潜む様々なリスクをチェック 企業法務の課題解決を強力にサポート LegalOn Technologiesの詳細を見る
力制御、コンピュータービジョン、AIを統合 汎用性の高い適応型ロボットを開発 Flexiv
力制御、コンピュータービジョン、AIを統合 汎用性の高い適応型ロボットを開発 Flexiv
力制御、コンピュータービジョン、AIを統合 汎用性の高い適応型ロボットを開発 Flexivの詳細を見る

NEWS LETTER

世界のイノベーション、イベント、
お役立ち情報をお届け
「グローバルオープンイノベーションインサイト」
もプレゼント


新規事業の
調査業務を効率化
成長産業に特化した調査プラットフォーム
BLITZ Portal
収集したスタートアップ情報の効率的な活用を支援する
スタートアップ協業案件管理ツール
Q-scout
社員の声でイノベーションを効率化する
アイデア管理プラットフォーム
Q-ideate

Copyright © 2023 Ishin Co., Ltd. All Rights Reserved.