藤巻遼平
(モデレーター:Stanford University APARC 櫛田健児氏)
※本記事は「Silicon Valley - New Japan Summit 2019 Tokyo」のトークセッションの内容をもとに構成しました。
何ヵ月もかかる機械学習・データサイエンスを数日で可能に。驚愕のスピードを実現
櫛田:NECで機械学習とAIを専門に研究し、史上最年少の33歳で主席研究員に就任したという藤巻さん。日本で5年間の研究所勤務を経て、シリコンバレーに拠点を移し、2018年にAIデータ分析の会社dotDataをカーブアウトする形でシリコンバレーで設立したそうですね。シリコンバレーに行ったのはなぜですか、望んで行ったのですか。
藤巻:私は大学卒業後、NECの研究所に入りまして、2011年に分析自動化の研究のためにシリコンバレーの研究所へ移りました。その時は何となく「シリコンバレーの研究者とコラボレーションできればいいものができるのでは」くらいの軽い気持ちでした。それほど順調だったわけではなく、他の技術を日本で事業化するために3年ぐらい時間をとられるなど、たくさん寄り道していた感じです。ただ、他の技術の事業化の中で様々なお客様のデータを分析する機会に恵まれ、結果的にそれがdotDataのコアのアイデアにつながりました。
櫛田:いまはどんな研究をしているのですか。
藤巻:機械学習に基づくデータサイエンスのプロセスを自動化する研究です。我々はその中でも特に、顧客データやプロダクトサービスのデータなど、企業の中核となるデータにフォーカスしています。
最近は、機械学習やAIが非常に注目されていますが、米国でも、80%の企業が機械学習やAIのプロジェクトに課題を抱えているという調査があります。各社、取り組みははじめているものの、なかなかうまく活用できていないのが現状です。それはデータサイエンティストがいないとか、その領域のナレッジがないとか、色々な問題があります。
機械学習というのは、データをアルゴリズムを入れたら答えが出てくる魔法の箱ではありません。熟練技術者の経験と勘、地道なマニュアル作業などが非常にたくさん必要とされます。しかも、統計数理の専門家だけではなく、業務の精通者、データのプロなど色々な分野から大人数が参加して、何ヵ月もかけてやっと結果がでるという大変に時間がと労力がかかるものなのです。
機械学習やAIのユースケースが爆発的に広がっている中で、ビジネスの仮説を立ててから一つのプロジェクトに何ヵ月もかかっていてはとても遅すぎます。また、限られた専門家にしかできないという点もユースケースを広げる壁になります。我々はこの課題をデータサイエンスのプロセス全体を自動化することで解決しようとしています。
櫛田:今のお話しを要約すると、機械学習の期待値はどこも高いけれど、データを活かしきれている企業は少ない。dotDataのお仕事は、「データサイエンス・機械学習のプロセスを自動化して各企業がデータをうまく活用できるようにする」と言えそうですね。
藤巻:データは基本的に業務をするために蓄積されるのであって、分析をするために集められているわけではありません。このデータはそのまま機械学習へ入力することはできず、統計数理や業務知見を駆使して特徴量と呼ばれる、機械学習入力となるデータへ変換する必要があります。この機械学習の入力を作る作業がデータサイエンス・機械学習の中で最も時間がかかり難しいところです。
しかも、統計数理だけ分かっていればいいというわけではなく、特徴量とは予測に効果のある変数なので、分析のユースケースを理解し、それに合ったビジネスの仮説に基づいて設計する必要があります。我々はその特徴量を自動設計する技術を開発し、機械学習モデルをつくるプロセス全体の自動化に成功したんです。この技術によって何ヵ月もかかっていた作業を数日に短縮することが可能となりました。
会社が変わるために、まず自ら変わる。コア領域をカーブアウト
櫛田:それはとても面白い、ワクワクするような話ですね。では、なぜNECさんでやらず、カーブアウトする形で独立することになったのですか。
藤巻:NECに限らず、いわゆる大企業型のR&Dでは難しいと思っていました。大きな企業では、まず基礎研究に2~3年かかります。それをソフトウェアの事業部が開発し、開発できたら営業部門が販売する。この時点ですでに5〜6年かかってくるので、スピードの速いマーケットでは戦えない。また、各部門の役割が別れているため、市場の状況に合わせて継続的に進化させ続けることも難しい。
もともとカーブアウトさせてほしいとNECへ言ったわけではなく、プロジェクト全体を自分にやらせてほしいと会社に直談判しました。新しい事業部を作るとか、我々のプロジェクトを子会社する、あるいは私とチームがNECをやめて会社を立てるなど、1年くらいかけて色々な議論がありました。その結果として、両者が協力し合い、一方で独立した組織としてスピードを持って動けるように「カーブアウト」という形になりました。
カーブアウトというと、一般的には会社の本業になりにくいとか、ビジネスになりにくい事業を社外に出します。今回のカーブアウトがとても面白いのは、NECはあえて将来性があり成長領域のAI分野、しかもそこのもっとも期待されている技術とチームをカーブアウトしたことです。市場で最速で成長させる、またこの技術を本当にグローバルな製品とするためには、NECの中で育てるのではなく、外の力を活用し、またシリコンバレーで育てるという決断をしました。
重要な人材や知財を社外に出すことになるため、はじめはNECのコーポレートからは様々な反対意見がありました。なぜ、NECが決断したかというと、もちろん事業計画をみて、株主としての金銭的インセンティブのそろばんをはじいて、などもありましたが、最終的には、NECの中にも長年事業がなかなかうまくいっていない危機感があり、「NECは変わる。そのためには一番いいものであってもリスクをとるんだ」という想いからだったと思います。「藤巻がやりたいから」ではなく、「NECのためにカーブアウトさせる」という流れになったんです。そうして2018年2月にデータ分析自動化の会社、dotDataを設立しました。
櫛田:dotDataを設立して約1年が経ちました。今の状況はいかがですか。
藤巻:現在、北米本社に加えて、日本とヨーロッパで、合計で50名程度のスタッフがいます。2016年に日本のお客様から始めたのでまだまだ日本との取引が多いです。現状のお客様は、金融、通信、製造、流通、航空など7~8業種にのぼります。
今年は「AI Breakthrough Best Machine Learning Platform Award 2019」を受賞し、「The Forrester New Wave」では機械学習自動化分野のリーダーであると評価をいただきました。北米でもだいぶ知名度が上がってきたと実感しているところです。
後編はこちら。