※TECHBLITZを運営するIshin Groupは「UC Berkeley Executive Education」の日本展開パートナーを務めています。
ビジネス、スポーツ界で起きている「データサイエンス革命」
――なぜ経営幹部がデータサイエンスを学ぶ必要があるのでしょう。
Kariv:例えば、あなたがレストランのオーナーだったとしましょう。あなたは市場の理解と、自分のレストランの調理場で何が起きているか、シェフが何をしているかを把握する必要がありますよね。自分自身がシェフになる必要はありませんが、シェフに指示を出せる程度の知識は必要です。そして、調理場で働くメンバーの労力を知るためにも、オーナーは現場を体験するべきです。データサイエンスに関しても、同じことが言えるのです。
いま管理職の多くは、データサイエンスが「革命」と言われるようになる前に大学を卒業し、データサイエンスについて学ぶ機会がなかった世代だと思います。しかし、今はビジネスだけでなくスポーツ界など、幅広くデータサイエンスに基づいた意思決定が行われるようになっています。もはや誰もがデータサイエンスを学ばなければなりません。
Image: Berkeley Executive Education Data Science Program
多くの方が、データサイエンスが起こす革命に期待し、ビッグデータが自分たちを救ってくれると思っています。しかし、データには常にノイズが存在しており、データサイズと比例してノイズも増える可能性があり、これは大問題です。
そして収集方法が不明なデータを使って、実際には誰も理解できていない機械学習アルゴリズムを実行しても、助けにはなりません。私たちは、収集するデータの種類と、実行するデータ分析の種類を統制する必要があると考えています。
データサイエンスという技術的なトピックを、経済理論や意思決定理論に融合させると、より複雑になります。しかし、私たちのデータサイエンス・分析プログラムは、その全てを理解するためのプログラムではありません。問題を自力で解決する力を養う、あるいは、解決するためにどういったスキルを持った人間が必要なのかを理解する力を養っているのです。
統計学、経済学、意思決定理論などの基礎理論からスタート
――データサイエンス・分析プログラムを開発するにあたり、苦労した点は何でしたか。
Tadelis:私たちはデータサイエンティストではないリーダーが、データサイエンティストを雇い、彼らの能力を最大限に活用するためのプログラムを開発しました。対象は、経営幹部と管理職です。データサイエンスと分析に対する理解を深め、業務改善への活用と、データサイエンティストなどの専門家との交渉力の向上を目的としています。
また「世の中には3種類の嘘がある。嘘、大嘘、そして統計だ」という有名な言葉がある通り、統計を使えば都合よくストーリーを作ることができます。
ですから経営幹部が、データドリブンな意思決定を行うためには、問題の提起、問題に取り組むために必要となる前提条件やデータの種類や最適な分析方法を把握できる能力が必要なのです。
Photo:everything possible / Shutterstock
――どういった点が「言うは易く行うは難し」だったのでしょうか。
Tadelis:データサイエンスの理論と実践の間でスイートスポットを見つけることが、このプログラムを設計する上で最も困難でした。
データサイエンスや分析の良し悪しを見分けるためには、確率評価や統計分析などの基本知識が必要です。そのため、基本プログラムは、統計学や経済学、意思決定理論などの基礎理論の講義から始めます。基礎ができてから、実際的な手法を習得します。
Image: Berkeley Executive Education Data Science Program
そして同時に、コーディングを学んでもらいます。コーディングをすると言うと、「こんなことをする必要があるのか?」と言う人がいますが、その理由はシンプルです。手を動かしたことがなければ、実際に作業するメンバーに共感できません。データサイエンティストほど深く学ぶ必要はありませんが、仕事を任せる相手の立場になり考えられるようになるためには、コーディングの経験が必要です。
私たちはよく「データリテラシー」という言葉を使います。データサイエンティストと生産的に関われるよう、経営者や意思決定者のデータリテラシーレベルを高めたいと考えています。
メキシコの農家はどんなスイカをいつ栽培し、いくらで売るべきか?
――具体的なプログラム内容を教えてもらえますか?
Tadelis:新型コロナウイルス以前は、対面で行うプログラムとオンラインプログラムを組み合わせて提供していました。受講期間は5〜6ヶ月で、2ヶ月毎に3回セッションを行い、対面のセッション時間は合計30時間に及びます。そして、対面プログラムがない期間に90時間にも及ぶオンラインプログラムを行います。
Image: Berkeley Executive Education Data Science Program
最初の対面セッションでは、主に統計学と経済的意思決定など基礎理論とモデルを学びます。その後、約2ヶ月かけて動画により学んだ知識を深めていきます。そして同時に、プログラミング言語のPythonとJupyter Notebookというツールを教え、実際にコーディングやデータの分析を行います。
2回目の対面セッションでは、統計モデルの応用、時系列分析による予測、重回帰分析、A/Bテストや機械学習などを、より深く掘り下げて学びます。また、1日かけてAirbnb、FacebookやNetflixなどのシリコンバレー企業を3社訪問し、実際にデータサイエンス・分析がどのように使われているかを学びます。
2回目の対面セッション後、約2週間の間に、実際のデータを使ったキャップストーンプロジェクトを始めます。参加者の会社が抱える問題を解決するために、実際にデータを分析し、プログラムの参加者にインサイトを提供します。
たとえば、あるメキシコからの参加者はスイカの販売ビジネスをしており、興味深いデータを持ってきました。彼の会社はメキシコの小規模な農家からスイカを仕入れて、アメリカで販売していました。メキシコでは年間を通じてスイカを栽培できますが、アメリカでは栽培できません。では、メキシコの農家はどの種類のスイカを、どのタイミングで栽培し、どんな価格で売ればいいのでしょうか。これは農家にだけでなく、誰にとっても複雑な決断です。彼はデータをもとにこれらの意思決定をし、そのインサイトを他の参加者にも共有しました。ここで共有された意思決定のプロセスとインサイトは、他の業界でも参考になる素晴らしいものでした。
Photo:Smit Photos / Shutterstock
最後の対面セッションでは、キャップストーンプロジェクトのまとめとなる実習指導を行い、戦略的意思決定についてさらに深く学びます。そして最後は、データサイエンスチームの構築、専門知識の適切な組み合わせ、データサイエンティストの面接方法などを学びます。
Kariv:今お話ししたプログラム以外に、個々の企業のニーズに応じてカリキュラムをカスタマイズすることも可能です。これまでも、業種やエリアに合わせてカスタマイズプログラムを提供してきました。
たとえば、数千人規模の巨大な投資ファンドでは、半数以上の社員がこのデータサイエンスプログラムを受講しました。私たちのプログラムを、より資金調達に重点を置いた内容にカスタマイズしました。
――なぜ統計学の基礎理論から学ぶことを重視しているのでしょう。
Kariv:機械学習とそれ以前に統計学で行われていることは別物だと考えている人が多く、皆が機械学習に飛びつきますが、実際は両者は地続きだと考えてよいでしょう。例えば、機械学習以外の方法で回帰を行う時は、自分で回帰の関数を決めなければなりませんが、機械学習なら機械がやってくれるというだけです。
Image: Berkeley Executive Education Data Science Program
今や少しでもコーディングの知識があれば、Pythonを使いデータ分析を行うことが可能です。分析を行えばある程度の結果が出てきますが、結果がでるまでの過程は把握できません。機械学習は大きなソーセージ製造マシンのようなものです。私たちはソーセージがどのように作られているか見ることができません。
Tadelis:統計学は、非常に直感的かつ技術的なもので、多くの人が騙されてしまいます。先ほどKarivが言っていたように、技術があれば、何らかの意味を持った分析結果を導き出すことができます。しかし、それが本当に意図した内容で意味を持った結果なのかは確認する必要があります。正しくデータドリブンになるためには、理論と実践の両方を理解する必要があるのです。
※TECHBLITZを運営するIshin Groupは「UC Berkeley Executive Education」の日本展開パートナーを務めています。