従来のGPUは「予約できないレストラン」。GroqのTSPは「予約できるレストラン」
GoogleでソフトウェアエンジニアだったRoss氏は、2013年から機械学習向けチップであるTPU(tensor processing unit)の開発に携わる。2015年には、Googleのコンピュートの半分以上がTPU上で動作するようになっていった。その後Ross氏はGoogleの次世代技術を開発するグループ会社Xに移ったのち、2016年にGroqを創業する。
Ross氏は、「CPUをプログラムするのは簡単ですが、GPUをプログラムするのは難しいです。しかし、機械学習やAIにはGPUの方が適しています。そこで私たちは、CPUと同じくらい簡単にプログラムでき、かつGPUよりも優れたパフォーマンスを発揮するチップを開発しました」と語る。同社のAI向けチップはTSP(Tensor Streaming Processor)と呼ばれ、競合製品の最大17倍もの速度を誇る。高速な理由についてRoss氏は、レストランの予約に例えて説明した。
「私たちのチップでは、プログラムがどれくらいの時間実行されるかがわかります。GPUの場合は、何千回もの処理を実行して平均の長さを求めます。レストランに例えるなら、GPUは予約しないで行って待たされるイメージです。ホストがあなたのパーティーの参加者全員が来るまで席を用意してくれないとしたらどうでしょう? 4人だったら少し待つかもしれないし、100人だったら何時間も待つかもしれないし、何千人だったら一晩中待っても席に着けないかもしれません。一方、TSPは予約したレストランに行くイメージです。時間通りに来れば、そのまま入れてもらえますね」。(Ross氏)
Ross氏は、チップに搭載されるトランジスタの数は数年ごとに2倍になっており、同時にサーバーの数も数年ごとに倍になっていることを指摘した。システムが利用するチップの数が多ければ多いほど、少しの遅れが大きな問題につながる。GroqのTSPは従来のGPUなどと比べて遅延が少なく動作するので機械学習やAIに必要な処理を高速に実行できる。
AI需要の高まりで急成長。厳選した採用で、優秀な人材の密度を高める方針
Groqは、自社のTSPを搭載したハードウェアを顧客に直接販売したり、TSPのチップのみを供給していたりする。主な顧客はアメリカ国内の金融系や自動走行車関連など、高度な計算を必要とする企業だ。またホワイトハウスなど、国家機関への提供実績もある。
Ross氏は、「金融企業では、非常に大きな問題を解決するために、膨大な数のチップを組み合わせてスケールアップしているのに対し、自律走行車やロボット分野では、いかに早く答えを出せるか、いかに少ないエネルギーで済むかが重要になります。自律走行車では、非常に電力を必要とするGPUを、当社のチップ1つに置き換えた事例もあります」とその性能をアピールした。
Photo: metamorworks / Shutterstock
AIの需要の高まりにあわせてGroqのビジネスは急成長しており、ここ半年でスタッフ数は倍の150名まで増えた。2021年4月に調達した3億ドル(累計360億ドル)の使途のひとつが優秀な人材の獲得で、現在60以上の職種で人材募集中だ。現在はアメリカとカナダが中心だが、海外にも目を向け、質の高い人材の採用を行っている。このため現在は応募者の1.4%しか採用していない狭き門となっている。
Ross氏は「弊社の人材は、本当に優秀であってほしいのです。この分野のほかの多くの企業は、事業を展開するだけで何万人もの人手を必要としています。私たちは、絶え間ない改善を行い、他社よりも少ない人数でより多くのことを行えるようにしたいと考えています。『人材の密度』を重視しているのです。これは私たちにとって非常に重要なことで、革新的であり続けるための方法なのです」と、採用のポリシーについて触れた。
コンピューティングのコストを限りなくゼロに近づけたい
Ross氏に日本への進出意欲について聞くと、自動車やロボット産業、金融業界などに対してアプローチしたい意向があるという。
「私は日本の製造業で開発された、継続的な『カイゼン』の大ファンで、日本の自動車やロボット産業にぜひ参入したいと考えています。日本への参入には2種類のパートナーが必要です。1つは、日本市場をよく知り米国企業との仕事に慣れているパートナーです。そしてもう1つが、革新的なことをなし遂げたい顧客です。既存のソリューションではうまくいかないからこそ、多少の努力を惜しまないからです」。(Ross氏)
GroqではTSPの性能だけでなく、今後はよりスケールアップした構成での性能向上についてのイノベーションを目指している。次世代チップの開発とともに、現行のチップを使った世界最大級のアクセラレータ・クラスターの開発を同時に展開している。同社の長期ビジョンについてRoss氏は次のようにコメントした。
Image: grop
「機械学習AIを行うためには、膨大な量のコンピュータが必要になります。私たちの使命は、コンピューティングのコストをゼロにすることです。1ドルでも安く多くのコンピュートを得ることができ、無料に近づけたいです。そして、大企業だけでなく、小さな企業にも公平に大規模なモデルをトレーニングできるようにしたいのです」。