(2021年にFiscalNoteが買収。2023年6月追記)
オンラインメタデータから政治的・金融的な出来事が予測できる
―Predataの事業について教えてください。
Predataは、オープンソース情報を解析し、リスクの定量的指標を生成して、地政学的に重要な出来事を予想しています。対象となる出来事は、安全保障や政治的・財政的傾向などです。
政治的出来事であれ金融市場での出来事であれ、重要な何かが生じる前に、出来事への参加者はインターネットで検索を行ったり、ソーシャルメディアにアクセスしたり、WikipediaやYouTubeなどのメディアを検索したりします。この点に我々は着目し、データコンテンツそのものではなく、この時系列のメタデータを収集し、AIを利用して予測を立てるのです。
―プラットフォームの仕組みはどうなっていますか。
プラットフォームには2つの異なるバージョンがあります。 一つは「Focus」と呼ばれるものです。国および市場のトピックと呼んでいる数百の事項を事前にプログラム化したもので、シンプルかつ低コストのバージョンです。もう一つのバージョンは「Foundation」と呼ばれるもので、複雑で高価ですが、 クライアントは自分自身の指標を作り、これを用いて予測を試みることができます。
―なぜデータコンテンツそのものではなく、メタデータに焦点を当てるのですか。
コンテンツデータそのものを見ることはできます。しかし問題は、データの内容を理解する能力が言語によって大きく異なることです。
デジタル会話の内容を理解するためのテクノロジーは、NLP(自然言語処理)と呼ばれるものです。コンピュータサイエンスでは、英語用のNLPライブラリはかなり優れていますが、日本語、アラビア語、または中国語については、まだあまり信頼できるものではありません。しかし、メタデータに関しては、すべて同じです。会話が中国語、日本語、アラビア語、英語のいずれであっても、メタデータアプローチは同じ条件で解析できます。
Image: Predata
北朝鮮のミサイルの発射時期は驚くほど正確に予測できる
―Predataの予測はどの程度信頼できますか
予測対象によって精度は異なりますが、例えば北朝鮮のミサイルの発射時期、エジプトなどで暴動が起きる時期の予測には驚くほど優れています。
金融市場は少しトリッキーです。たとえば円ドルが大きく動く前にインターネットに接続して会話をする人の数は、北朝鮮のミサイル発射の時と大きく異なります。また、米ドルとユーロ、ブラジルレアルと米ドル、それらの通貨によってもパターンが異なります。
銅や石油など、多くの商品の価格上昇を予測することもできます。例えば、世界の大豆の大半は、ブラジル、米国、アルゼンチンの3か国で、私たちはこの3か国で行われている会話を捉えるのは得意です。しかし、石油については生産国が12程度あり、交わされるのははるかに複雑な会話です。いずれにしても、機械学習を使っているので、日々予測はより正確になっていきます。
―どんな顧客が利用していますか。
政府機関、それから資産運用会社やヘッジファンドなどの金融機関が中心です。顧客数としては、政府機関が数十、金融機関も数十といったところです。ほかに日本の総合商社からも数社、問い合わせを受けています。
基盤となるテクノロジーは共通で、予測対象が異なります。政府機関の場合、北朝鮮によるミサイル発射のような政治的出来事に関心があります。金融業界では、商品価格や通貨の大きな変動を予測しようとしています。
Image: Predata
ローカライゼーションパートナーを求め、日本にも強い関心
―なぜPredataを起業したのですか。
私はプリンストン大学で教えていましたが、2001年のアメリカ同時多発テロの後、2003年から2009年にかけ、中央情報局(CIA)で働きました。そのとき、事件を予測するためにオープンソース情報を使用する方法に非常に興味を持つようになりました。
プリンストン大学の工学部教授に戻ってから数年間、私はこのパズルに取り組みました。そして私はプリンストン大学の学生たちと一緒にPredataを始めたのです。
―海外戦略、特に日本企業とのコラボレーションの可能性はどうでしょう?
すでにPredataのテストを始めた日本企業があります。Predataを正しく実行するには、日本語のインターフェース、日本語のユーザーエクスペリエンスそして日本での技術サポートが必要です。
私事ですが、私の妻は日本人で、長男は日本に住み遺伝子研究をしています。家も日本にあり、私自身、頻繁に来日しています。日本への関心はきわめて強く、ぜひ日本市場の拡大に取り組んでいきたいと思います。