音声認識と機械翻訳と字幕入れを一気通貫できるソフトウエア
動画コンテンツを世界へ発信するには、各言語への翻訳字幕が欠かせない要素だが、動画字幕の翻訳環境には多くの課題がある。
「Make your contents accessible to the world(さあ、世界へ飛び出そう)」をミッションに掲げ、課題解決と動画コンテンツをもっと気軽にローカライズできる世界の実現を目指しているのがAI Communisだ。起業のきっかけは、創業以前に投資会社でAI分野のキャピタリストを務めていた鈴木氏と、投資候補企業の役員だったIan Lean氏との出会いだったという。
「元々は私はシンガポール駐在の銀行員で、その後、投資会社へ転職しました。投資候補企業のCTOで、大学でAIの専門家として教えていたIanに出会い、同じ年齢だったことから意気投合したんです。彼から『東南アジアからの留学生は卒業後、自国へ戻らずGAFAなどへ就職してしまい、自国での自然言語処理や音声認識は誰も携わっていない』と聞きました。シンガポール在住だった私なら、銀行営業の経験もあるからBizDevもできます。Ianの持つ技術がそこに重なれば新しいビジネスが生み出せると思い、デスクリサーチを始めたのが起業のきっかけです」
最初の事業アイデアは、金融機関の営業窓口での会話を記録しAIで解析するコンプライアンスサービス。しかし、うまくいかず半年ほどで方針を転換し、資金集めとAI用教師データトレーニングの収集を目的に、クラウドソーシングで文字起こしを始めた。これがAurisの開発につながることとなる。
「文字起こしだけでは単価も低く、会社のビジネスにはなりません。しかし、直接仕事を請け負ううちに、文字起こしの翻訳や、翻訳テキストを字幕として動画に入れたいというニーズがあると分かりました。また文字起こし・翻訳・字幕入れはそれぞれを別々の業者に依頼するのが一般的で、それぞれの業務をまとめて行えば採算が取れるようになると気づき、音声認識と機械翻訳と字幕入れを一気通貫できるソフトウエアAurisを開発しました」
Aurisを使うことで、分業で発生していたデータの受け渡しや業務の申し送りなどを省けるようになり、翻訳字幕制作にかかる時間は大幅に短縮。ビジネスとしての手応えを感じた鈴木氏は、正式にソフトをリリースしシンガポールでAI Communisを創業する。
アメリカ企業による新製品発表イベントの動画を翻訳して日本語や中国語の字幕を入れたり、ピッチコンテストに寄せられる応募動画の審査迅速化のために翻訳字幕をつけるというニーズに応えるべく開発されたため、当初からAurisは多言語対応を念頭に置いていたと鈴木氏は語る。
独自ソフトウエアAurisと企業向けの翻訳ソリューションが収益の柱に
AI Communisの収益の柱は、Aurisを利用する有料ユーザーからの課金、そして翻訳字幕入れサービスなどの企業向けソリューションの2つだ。Aurisの開発とソリューションとの関係性を鈴木氏は次のように説明する。
「Aurisはフリーミアムモデルを採用し、ユーザー登録すれば1カ月あたり合計60分まで、文字起こしと翻訳・字幕入れが無料で利用できます。それ以上の作業には有料プランの購入が必要になります。無料ユーザーと有料ユーザーの合計数は2023年1月上旬現在で12.2万人に達しています。ユーザーからなるフリーランサープールを活用しソリューションを企業に向けて提供しています」
ユーザー登録後のオンボーディング時に「業務依頼が可能」と回答したユーザーを中心に、現在は3000人ほどが登録されている。企業から受託した翻訳字幕入れ案件をAurisのユーザーである彼らに依頼することで、短納期対応と低コスト、高い翻訳品質を実現している。
翻訳字幕ソリューションの提供先には、翻訳専門会社のほか、海外展開を企図するタレントプロダクションやメーカーなどがあるという。
ソリューション案件における翻訳ニーズの7割は英語からの翻訳。国別のAurisユーザー数ではインド、フィリピンが多く、いずれも英語のネーティブスピーカーの多い国だ。
「インドやフィリピンなどの東南アジア諸国はアメリカから見ると“地球の裏側”にあたり、時差が約12時間あるので、アメリカ時間の夜に翻訳を依頼すると翌朝に納品が完了できる」と鈴木氏は語る。
Image: AI Communis
翻訳字幕制作の実務を熟知 スピード重視のニーズに対応できるのが強み
Aurisの高い機能性、そしてAurisユーザーのフリーランサーからなるタレントプールを活用したソリューション提供により、工数を削減し短納期を実現しているのが特徴だ。その強みの源泉を鈴木氏は次のように分析する。
「1つは、私自身が翻訳字幕制作の実務を経験し熟知していること。Aurisの機能開発では直接エンジニアに実務者視点で指示を出して、AIと実務とを統合しています。さらに企業から翻訳字幕の仕事を受注するときにも実務経験は役立っています。クライアントの担当者は翻訳字幕制作が分業になっていることもあり、その実務の全体像を知らないケースがほとんどです」
「実務に加えて、音声認識や機械翻訳、自然言語処理を理解しているので、クライアントの要望を技術的に解決できるかイメージできます。いわば実務とAI技術との“掛け算”をクライアントニーズに即したかたちで説明できるのが強みです」
「近年の翻訳ニーズにマッチしたという点も強みといえます。映画字幕に求められるような高い作品性やクオリティーを要求されるものと、高頻度で公開されるYouTuber動画などに求められるスピード・価格重視のものと、翻訳字幕のニーズは二極化しています」
「1時間の動画の字幕入れであれば、これまでの業界標準では20日ほどかかっていたものを、当社ではその半分程度の期間で納品できるため短納期・低価格を求めるニーズにマッチしているのも強みです。環境要因としては、動画市場の急激な成長に加えて、インド・東南アジア地域では競合サービスが少ないことが挙げられます」
大企業のプロモーションを担う広告代理店との提携を目指す
同社が提携先・協業先としてアプローチを目指しているのが、大企業のパートナーとしてプロモーション動画の制作やマーケティング展開を担う大手広告代理店だ。一例として、大手芸能事務所によるタレントの海外展開に欠かせない動画コンテンツの翻訳がある。
鈴木氏は「WEBサイトを翻訳するだけにとどまらず、ライブ映像やMVなどの翻訳ニーズも生じます。大企業の広告コンテンツなどをプロモートする広告代理店などと提携して、翻訳ニーズにまとめて担当するビジネスパートナーとして協業したい」と語る。
2022年12月には日本国内でもAurisのサービス提供を開始し、さらなるユーザー獲得を目指す。「2023年中に30万ユーザー」との目標を掲げる鈴木氏は「昨年末で11万ユーザーを突破し、今年の1月上旬には12.2万ユーザーに達しました。2023年中の目標としていた30万ユーザーは達成できる見通しです」との見通しを示した。
特に重視しているのが有料プランのユーザー拡大だ。有料ユーザーを増やす施策について鈴木氏は説明する。
mage: AI Communis
「有料プランユーザーの増加施策として考えているのが、各国のメジャーなペイメントサービスを決済方法に追加することです。現在はクレジットカードにのみ対応しているため、ユーザーが日常的に使う決済サービスに対応すれば、有料プランがより使いやすくなります。複数のペイメントサービスの導入要件を満たすには大きな手間と時間がかかりますが、有料ユーザーを増やすためには欠かせないと考えています」
音声認識で生成した翻訳データを、字幕だけではなくAIによる合成音声として動画に合わせる多言語対応吹き替え機能の実装も予定している。2022年8月には音声合成を研究する東京大学の高道慎之介助教と学術指導契約を締結し、AI Communisの音声認識・自然言語処理とを融合させた機能の実現を着々と進めているという。鈴木氏は将来的な新たな吹き替えニーズへの対応する考えを示した。
「翻訳字幕と同様に、吹き替え音声も“品質重視”と“スピード・価格重視”とでニーズが二極化しています。これまでの吹き替えはクオリティーが高い反面、専用スタジオや声優さんの手配が必要になるなど、費用も大きく時間もかかりました」
「合成音声での吹き替えでも、スピード・価格重視のニーズに応えられるクオリティーが技術的に担保できるようになれば、例えば日本のYouTuberの動画を合成し、本人が外国語をしゃべっているかのような吹き替えを手軽に作れます。まずはB to Cでの翻訳吹き替えサービスローンチを目指し、メタバース上のアバターやVTuberの吹き替え需要にも応えられるものにして、将来的にはB to BでのSaaSサービスへと展開したいです」