目次
・AIが何をしているかを理解する
・エンジニア視点のソリューションを市場が支持
・「2024年はマルチモーダルが注目される」
AIが何をしているかを理解する
―職業的背景と創業の経緯を教えてください。
実は、私は2度目の創業をしています。最初の会社を立ち上げたのは約15年前で、ガレージで2人で始めた小さな会社が、上場企業へと成長しました。その会社はプログラマティック広告を扱い、私たちはソフトウェアを利用して、どの広告枠をリアルタイムで購入するかを、機械学習とAIに基づいて決定できる仕組みを作りました。具体的には、各広告がどこに掲載されるか、誰をターゲットにするか、どのような頻度で、どのような方法で提供するかといったことを決定していました。
AIがビジネスを動かすので、もしもAIのモデルに問題があれば、文字通り1日に何百万ドルもの損失を被るような世界です。データサイエンスと機械学習エンジニアリングチームをつくり、そのような問題の最前線で過ごしてきました。その中で、AIモデルの問題を把握するソフトウェアが必要だということに気づいたのです。会社は上場後の2019年にはAdobeに買収され、私は半年ほど休んだ後にArize AIを立ち上げました。
Arize AIでは「AIが何をしているかを理解する」ためのソフトウェアを提供しています。共同創業者のAparna Dhinakaran(CPO、最高製品責任者)はUber出身で、機械学習のエンジニアとして勤務していました。そして、同じようにAIのオブザーバビリティー(可観測性)に関する課題を抱えていたのです。
―現在提供しているプロダクトについて教えてください。
私たちは、AIの動きを私たちのAIでモニタリングしています。例えば、ChatGPTで何かを開発している場合や独自のAIを構築している場合には、私たちの少量のコードをそのコードに組み込むことで、AIシステム全体を包括的に理解します。その後、AIモデルの内部から情報を取り出し、大規模言語モデル(LLM)を用いて、AIの機能を人間が理解しやすいインサイトとして提供します。これにより、そのモデルがビジネスにおいてどのような意思決定を行っているかを分析し、理解することができます。
Uberは私たちの顧客で、到着予定時間を予測しています。交通量やイベントなどによって、予測される時間は異なることがあります。Uberの目標は、実際の所要時間を正確に伝えることで、私たちはUberが予測を大きく外していないかを確認し、その理由を理解する手助けをしています。
製品ラインは大きく2つあります。1つは初心者でも簡単に使えるオープンソースソリューション「Phoenix」で、開発サイクルの初期段階に適しています。もう1つのメインプラットフォームはSaaS形式で、顧客のインフラストラクチャ内に完全に展開できるバーチャルプライベートクラウドも提供しています。このプラットフォームは、常に稼働するモニタリングや本番システムの理解を目的としています。実際の世界でAIが直面するかもしれない予期せぬ事象や相互作用に対応するためのものです。
image: Arize AI HP
―AIのハルシネーション(幻覚)などの問題が取り上げられていますが、どのように考えていますか?
ChatGPTなどを使うときに、ハルシネーションのような現象を感じることがありますね。私たちの製品は、顧客専用のデータを学習することで、これを避けています。例えば、私が保険会社の社員で、会社のポリシーや製品情報を詳しく知りたい場合、そのドキュメントを参照することで事実を提供します。
LLMにドキュメントを接続するRAG(Retrieval Augmented Generation)という技術を使って、それがハルシネーションを起こしたかどうか、ドキュメントが正しかったかどうか、リンク参照が正しかったかどうかをチェックするなど、多くのソリューションを提供しています。
image: Arize AI HP 「Phoenix」
エンジニア視点のソリューションを市場が支持
―この分野に競合はいますか?またビジネスの状況についても教えてください。
AIモニタリングの分野において、私たちは市場をリードする立ち位置にあり、最も近い競合他社よりも10倍の規模の顧客基盤を持っていると自負しています。支持される理由の1つは、私たちのソフトウェアが開発者に重点を置いて作られていることです。一方で、競合他社の中には、規制的なアプローチを取るものもあります。私たちはエンジニア出身が多く、エンジニアリングチームが直面する問題を解決することに専念しています。
競合との差別化という点では、私たちはモデル分析やモデルパフォーマンスに関する特許を7つ以上取得しており、技術力にも自信があります。私たちの最も優れた技術は、AIモデルのパフォーマンスに関する問題が何によって引き起こされているのかを理解し、それに対処する手助けができることです。
「2024年はマルチモーダルが注目される」
―今後1〜2年のマイルストーンについて教えてください。
直近の半年間だけを見ても、AIがどんどん普及していく様子を目の当たりにしてきました。ChatGPTだけでなく、画像や映像解析など、さまざまなAIモデルが登場しています。私たちの役割は、これらの新しいAIモデルをサポートし、企業がAIを組織全体で使えるようにする手助けをすることです。人々がビジネスの核としてAIに基づく手法へと移行する際に、私たちはその基盤となることを目指しています。2023年がテキストとLLMの年であったとすれば、2024年はマルチモーダル(複数の異なるタイプのデータや入力モード)が注目される年になると思います。
―日本企業との提携などについてはどのようなお考えをお持ちですか。
現在、私たちは日本企業とのパートナーシップはありません。私自身は前職で、多くの日本企業との関わりを経験しました。特に日本市場の専門知識に加えて、良い技術的基盤を持つ人々を探しています。この巨大な市場の基礎を築くことに情熱を持つ人々を探しています。私たちの製品に興味がある方々や顧客になりたい方々との協力を望んでいます。
オープンソースとして提供しているプロダクトもありますので、無料でPoCとして試すことができます。私たちのチームに連絡していただければ、設定の手助けもできるでしょう。AIの展開を目指している方々は、実世界で直面する誤解釈やリンク参照の誤り、著作権に関する問題などに対処する必要があります。発言が企業のブランドに悪影響を及ぼす可能性もあるため、保護措置を講じ、発言内容を監視する必要があります。このような課題を抱えている方達は、ぜひ私たちにご相談いただきたいです。
―最後に、長期ビジョンとAI活用の将来像について教えてください。
私たちのビジョンは、AIが何をしているのかを人々が理解するのを手助けするソフトウェアを提供することです。AIがどこにでも存在し、より複雑になり、超人的なレベルに達するにつれ、それが何をしているか、望まない動作をしている場所はどこなのかを理解する必要があります。そして、そのような問題をどのように修正するかも重要です。私たちは、このような技術的なサポートを提供することを目指しています。
私は約20年間、テック業界にいますが、特に過去2年間のAIの進歩はこれまでにないほどの速さで進んでいます。これから登場するであろう驚くべき魔法のような製品やソリューションは、一夜にして既存の産業やビジネスを変える可能性を秘めています。しかし、これらを全て機能させるのは簡単ではありません。
アメリカでは、GPT-4やOpenAIなどの技術が素晴らしいスピードで採用されています。これらはビジネスを変える力を持っており、競合他社がこれらを採用していて、あなたが採用していない場合、大きな不利益を被ることになるでしょう。ですから、遅れずに採用することが重要です。採用する際には、問題が発生したときにそれを特定し、改善する方法を見つけるためのソリューションを持つことも大切です。