目次
・起業を後押しした2つの技術革新
・既存の監視カメラは交換する必要がない
・映像の「文脈」を理解できる、だから生まれた価値
・日本はグローバル展開時の重要な候補国
起業を後押しした2つの技術革新
―ご自身の経歴とSpot AIを立ち上げた理由についてお聞かせください。
私はインドで会社を創業・売却した後、スタンフォード大学の大学院に進学し、その後、インダストリアルオペレーションを手がけるSamsaraという会社で働いていました。同社では、運輸・物流企業向けのIoTソリューションを提供していました。そこでハードウェアとソフトウェアの融合に強い関心を持ちました。
そこではトラックの運転席に設置する小型カメラを開発したのですが、1台のトラックのキャビンだけでも、映像が事業にもたらす影響は非常に大きいことに気付きました。そこで、物流チェーン全体、事業全体の映像を、オペレーター、安全管理者、経営陣が活用できるようになれば素晴らしいと考えました。
同時に、世界では2つの重要な技術革新が起きていました。NVIDIAのGPUによってエッジ(ネットワークでの端末機器)での処理能力が飛躍的に向上し、映像を理解するAI技術も急速に進化していたのです。10年後を見据えたとき、全てのカメラがインテリジェントなセンサーとなって企業活動を支援する、それが必然的な未来だと確信しました。
既存の監視カメラは交換する必要がない
―現在の製品についてお聞かせください。
私たちの技術プラットフォームは、あらゆるIPカメラと接続できます。お客様は既存のカメラを交換する必要がなく、そのまま「AI Agents」として活用できます。安全性、セキュリティ、オペレーションの各面で業務改善を支援します。主な顧客層は、製造業、物流業、住宅関連企業と多く取引があります。また、さまざまな自動車サービス企業、小売業、学校、地方自治体にもご利用いただいています。収益モデルはフィード数に応じた課金制です。システムで処理するカメラフィードの数に応じて、1台当たりの月額料金をいただいています。
私たちのシステムを使うと、たとえば安全面では工場内でのフォークリフトのニアミス、立ち入り禁止区域へのフォークリフトの進入、安全装備・保護具の着用状況などを検知できます。作業現場での安全規則の遵守状況を確認できます。セキュリティ面では、フェンス越え、触媒コンバーター盗難、不審者の徘徊、建物への不審者侵入などを検知します。オペレーション面では、無人の作業場所やキオスクの検知、作業時間の過度な長さ、車両のアイドリング時間、行列待ち時間などを把握できます。また、人や車両のカウント機能もあり、オペレーションの最適化を支援します。
―2018年に創業されたとのことで、この間に世界はコロナ禍を経験しました。御社のビジネスにどのような影響を与えましたか。
当時、最大の顧客は不動産管理・不動産分野でした。パンデミック初期、この分野は家賃回収などで大きな打撃を受けました。そこで私たちは倉庫業や製造業への販売を強化しました。その後、倉庫需要が急増し、それが私たちの成長を後押ししました。
―具体的な成功事例をお教えいただけますか。
製造業の事例をお話しします。製造業は、パンデミック下でも多くの企業が操業を継続していたため、当社にとって重要な注力分野でした。現在もそうですし、今後も長期的に重要な分野であり続けるでしょう。
製造業にとって最も重要なのは安全性です。課題は、施設がたとえば50万平方フィートと非常に広大なものの、通常は安全管理者が1人しかいません。その1人が、ヘルメット未着用や危険な運転をするフォークリフトなどの安全上の問題がないか、広大な施設内を巡回しなければなりません。
従来のカメラシステムは受動的で、天井に設置されたままで、何か起きたという報告を受けた後の調査にしか使用されませんでした。一方、私たちの「Video AI Agents」は、24時間体制で行われる生産活動を常時監視し、その中から重大なリスクや問題を抽出します。
製造現場では24時間体制で生産が行われており、当社のシステムはその全ての時間の映像を常時監視し、重大なリスクや問題を抽出します。例えば、先日訪問した施設では、1サイトに5つの建屋があり、それぞれが24時間体制で稼働していますが、1日当たり8~10件のフォークリフトのニアミスが発生しています。私たちのシステムは常時監視の目となって問題を正確に把握し、即座にフォークリフト運転手に注意喚起することで、事故を未然に防ぐことができます。
また、保護具の未着用も検知します。これらの機能により、ある製造業のお客様では事故・怪我を40%削減しています。測定できることは、より良く管理することができるのです。
―競合についてお聞きしたいのですが、同じようなサービスを提供している企業との違いは何でしょうか?
大きな違いがいくつかあります。まず、私たちはカメラの提供はしていません。多くの競合企業はカメラを提供していますが、私たちはカメラの上に乗るインテリジェンス層の提供に特化しています。競合他社の場合、彼らのソフトウェアと彼らのカメラしか使えませんが、私たちはあらゆるカメラと連携可能です。これは大きな違いです。また、1台のカメラ当たりの計算処理能力が従来の3~5倍あるため、検知できる動作の数が圧倒的に多いのも特徴です。
映像フィードへのアクセスだけでなく、安全性、セキュリティ、オペレーションに関するレポートを作成できます。収録された全ての映像を見直す必要はありません。「このフォークリフトが特定の部屋にいた回数」「人の近くにいた回数」「速度超過した回数」などを簡単に検索できます。
image : Spot AI HP
映像の「文脈」を理解できる、だから生まれた価値
―2024年10月に資金調達をされています。事業の成長や、今後のマイルストーンについておきせください。
現在、約1,000社のお客様に6,000以上の拠点でご利用いただいています。私たちは2022年から2024年の間に事業規模が約10倍になるなど、急速な成長を遂げてきました。この度の資金調達については、主に研究開発チームの拡大とAI分野の最先端への投資に充てるとともに、販売網の拡大とマーケティング・営業チームの強化にも活用していく予定です。
サービスは現在、米国全土で展開しており、当面はこの市場に注力していく方針です。私たちはこれまでも業界の先駆者として、昨年のAI Copilot、今年のAI Agentsの導入など、数々の「初」を実現してきました。AIは急速に進化を続けていますので、今後もお客様の視点に立って、最新のビデオAI技術を提供し続けることをお約束したいと考えています。
私たちのAI Agentsは、従来の物体検知モデルとは大きく異なります。従来のモデルが単に物体を検知するだけだったのに対し、物体の検出と追跡 (人、車両、機器など)、環境コンテキスト (場所や時刻など)、および観察された動作 (動きや非アクティブ期間など) を融合して、フレーム内で起きている状況の文脈全体を理解できます。
Video AI Agentsは、現場をインテリジェントに分析し、潜在的な安全上のリスク、運用上の非効率性、セキュリティの侵害を推測します。これらの洞察は、条件付きロジック (「if-then」ステートメント) にマッピングされ、AI Agentsがアラートの送信、レポートの生成、現場の機器の調整などの自動アクションを実行できるようにします。
image : Spot AI HP 「Video AI Agents」
日本はグローバル展開時の重要な候補国
―日本市場についてどうお考えですか。日本企業と協業する際、どのような関係性が望ましいとお考えですか。
今のところ米国法人を持つ日本企業との取引がある可能性はありますが、日本市場への本格的な進出はこれからです。日本は製造業が非常に強く、多くの製品を生産している素晴らしい市場だと思います。そのため、グローバル展開を考える際の重要な候補国の一つとして捉えています。
日本企業との関係構築にあたっては、他のお客様と同様、お客様起点で製品を構築していきたいと考えています。単なる製品販売に留まらず、コンサルティング的な関係性を築きたいと思います。お客様にとって最も重要なことは何か、事業をどのように考えているのかをしっかりとお聞きした上で、ビデオAIがどのようなニーズに応えられるかを共に考えていくパートナーでありたい。それが収益増加であれ、工場の安全性向上であれ、作業員の安全確保や盗難防止であれ、お客様のニーズに応えていきたいと考えています。
―長期的なビジョンについてお聞かせください。
私たちのビジョンはシンプルです。今後10年でカメラセンサーはより安価になり、世界中でさまざまな形態のカメラが増えていくと考えています。私たちはそれらすべてのビデオAIプラットフォームになりたい。言い換えれば、現在のAIは主にコンピュータやスマートフォンのデジタルスクリーン上で活用されていますが、私たちはそれを物理的な現場のオペレーションにおいて真に有用なものにしていきたいのです。
最後に、日本の皆様へのメッセージですが、これは他の国々と同じです。ビデオAIの活用をお考えであれば、私たちは必ず皆様の良きパートナーになれると確信しています。