ディープラーニング専用に設計された大型半導体とコンピューターシステム
―御社はどのような事業を展開しているのでしょうか。
Cerebras Systemsは、「ディープラーニング専用のコンピューターシステム」を開発しています。大型半導体チップ「WSE-2(The Cerebras Wafer-Scale Engine2)」を搭載したAIコンピューターシステムの「Cerebras CS-2」(以下、CS-2)です。
AIとディープラーニングのトレンドに馴染みのない方に向けて、なぜディープランニング専用のコンピューター・システムが求められているのか説明しましょう。ディープラーニングとはそもそも、AIの機械学習の方法の1つです。複雑な判断や細かな処理が可能で、画像処理や自然言語処理などに活用できるのが強みです。
ディープラーニングの計算処理には、CPU(Central Processing Unit)ではなく、GPU(Graphics Processing Unit)を使うのが一般的です。ただ、このGPUによる計算に関しては、OpenAIの「ChatGPT」などの複雑な言語処理アプリケーションの計算の際には、キャパシティが足りず、どうしてもエンジニアが人手で調整する必要がありました。そもそも、GPUは、AIのニューラルネットワーク計算用には設計されていなく、画像処理用に作られています。
当社のCS-2は小型冷蔵庫ほどのサイズで、GPUよりも高速に、省電力で計算を行い、ディープラーニングのパフォーマンスを最大化します。具体的な数値で表すと、CS-2が1台あるだけでGPUの数百倍の性能を発揮するのです。
―競合他社と差別化を図っている点を教えてください。
当社の競合は、世界最大の半導体製造企業であるNVIDIAです。
CS-2に搭載している当社開発の半導体WSE-2は競合よりキャパシティが大きく、スケールしやすいという強みがあります。
事実、WSE-2はNVIDIAのGPU「A100」の約56倍のサイズで計算コア数は約123倍、さらに約1万2,733倍のメモリ帯域(データ転送可能能力)を有しています。
個別企業の成功事例をお伝えすると、フランスの電力会社TotalEnergiesは、CS-2を導入したことでA100より200倍以上早く計算ができるようになったと論文で報告しています。電力会社は風力発電の建設や石油・天然ガスの採掘場所を、膨大なデータ分析に基づく「ベストな選択肢」を選び取る必要があります。そうした中では、CS-2のように、高性能のコンピューターが必要なのです。
また、CS-2は、アストラゼネカ社などの製薬会社をはじめ、アメリカ国防総省などの政府機関、がん治療のアルゴンヌ国立研究所などの研究所で導入されています。顧客はアメリカを中心に、ヨーロッパ、日本にも存在します。
Image:Cerebras Systems
Image:Cerebras Systems
「非中央集権型」GPTを構築 オープンソース化
―御社は、ChatGPTをはじめとして世界で話題のLLM(Large Language Model:大規模言語モデル)のオープンソース化にも成功したようですね。
OpenAIのChatGPT-4やMetaのLLaMAは、大規模言語モデルでトップを走っていますが、残念なことに、データの取得元や技術的な詳細情報は非公表になっています。
つまり、大規模言語モデルは本来「非中央集権型」で「自由」であるべきはずなのに、これらのサービスは「中央集権型」で「閉鎖的」になっているのが実情なのです。その理由にここでは深く立ち入りませんが、主に収益面を考えてのことなのでしょう。
当社は、AIは人類共通の財産だと考えています。そのため、独自の大規模言語モデルを構築することにしました。それが、3月28日にリリースを発表した「Cerebras GPT」です。これは、完全なオープンソースになっていて、GitHubから誰でも入手できます。
当社が独自のGPTを、それも、オープンソースで構築できたのはCS-2のおかげです。他社はGPUと平均10〜30人のエンジニアという人的資源を投入して、数カ月間かけてGPTを構築したと考えられます。
Cerebas GPTは、当社が所有するクラウドサービス専用施設の「Cerebras AI Model Studio」で、CS-2と同じく当社が開発したAIスーパーコンピューターの「Cerebras Andromeda」にDeepMindが開発した「Chinchilla」の7つのモデルを学習させました。そして「キーボード1つ」で「数週間」でGPTを構築できたのです。
さらに、GPT構築のためのコストも他のサービスよりも優れています。「Cerebras AI Model Studio」では、AWSを介するよりも8倍速くGPTを構築し、コストも約半分に抑えることができました。
Image:Cerebras Systems
―あらためてですが、Cerebras Systemsを創業した経緯を教えてください。
私を含む5人の共同創業者は、当社を創業する前に、アメリカの半導体製造企業のAMDに勤めていました。退職後、みんなそれぞれ休暇を楽しんでいたのですが、妻たちからそろそろ家にずっといるのはやめてくれと言われたのです(笑)
そして5人が集まり、次にどんなことをしようかとアイデアを出し合いました。2015年11月のことです。
その時に交わした会話は「この“AI”ってやつは、急激に進歩するかもしれないな」というものでした。
「だとしたら、画像処理のためのGPUをAIに使うことは、もはや時代遅れなのではないか」「AIのための、より良いプロセッサーをつくれないだろうか」と、トントン拍子で話が進み、2016年にCerebras Systemsを創業したのです。
製薬や金融、ハイテク、通信分野での協業を希望
―日本市場をどのように見ていますか?
革新的な製品に対する需要という観点から見ると、日本市場はアメリカと比べて、より成熟したプロダクトを求める傾向にあると考えています。また、日本経済は破壊的なイノベーションが産業構造そのものを変革するというよりは、日本独特のタイムラインに沿って経済発展していくのではないでしょうか。
ですから、日本市場への本格参入を考えた場合には、東京エレクトロンデバイスとの戦略的パートナーシップのように、業界を知り尽くした現地企業との協業が必要となってくるでしょう。
協業の可能性がある業界としては、製薬や金融、ハイテク、通信などが挙げられます。ご承知の通り、日本は「富岳」など、スーパーコンピューターの分野で世界をリードしていて、これにディープラーニングを掛け合わせた製品・サービスは今後、非常に多くのチャンスを掴んでいくことでしょう。Cerebras Systemesも、AIサイドから、拡大する市場を掴んでいきたいですね。
―日本の大企業とのパートナーシップを考えた場合、どのような形態のものがベストだとお考えでしょうか?
形態に特にこだわりはありません。それよりも、見込み顧客がCS-2を導入して、研究範囲を広げたり、深掘りしたりする意欲があるかどうかを重視しています。CS-2は既存の研究分野をより拡大し、マーケットサイズを広げ、新たな問題の解決に最も威力を発揮します。業界のパイオニアを目指している企業とのパートナーシップを希望しています。
―最後に、御社が向こう12カ月で注力していくことについて教えてください。
Cerebas GPTを強化していく考えです。Chat GPT-4の例から分かるよう、現在大規模言語モデルには大きな注目が集まっていて、当社もより多くの言語モデルを学習させ、強固なエコシステムをつくっていきます。
GPTに対する盛り上がりの最大の理由は、それが「普通の人々を注目させた最初のAI技術」だからではないでしょうか。例えば、SiriやAlexaのようにこれまでも大規模言語モデルを搭載した製品・サービスはありましたが、GPTほど「賢い」と思われるレベルにはなかったということでしょう。
テクノロジーはいつの時代も発展していくものです。GPTがお茶の間に浸透すれば、人間の生活・仕事を補完して、人々がより便利に暮らし、クリエティブな仕事に従事するようになるでしょう。