この記事では、データサイエンティスト志望する高校生や大学生に向けて、データサイエンティストとはどんな職業なのか、またおすすめの大学や大学院(研究室)の情報をまとめました。
「データサイエンティストになるためには大学/大学院でどんな勉強すればいいのか」
「具体的にどんな仕事内容なのかを知りたい」
という方の参考になれば幸いです。
Contents
データサイエンティストの仕事は?
データサイエンティストには大きく分けて2種類のタイプがあります。一つが研究開発を進めるタイプ、そしてもう一つのタイプが、ビジネスの現場で課題を解決しようというタイプです。つまり、直接的に企業の利益にはならないがデータ分析により未知のものを開拓する「研究者」と、企業の問題解決をサポートする「ビジネスマン」に分けられます。
二つのタイプに共通していることは、複雑で膨大な資料の中から、データ処理や統計処理を行い、あなたが所属する企業や団体にとって、本当に必要な情報を抽出することです。現在ではIT業界はもとより、メーカーや金融、交通、流通、サービスなど活躍の場はさまざまです。これからのビッグデータ時代にはデータサイエンティストを求める企業の声が年々強まっています。
データサイエンティストになるために大学や大学院は必要か?
結論からいいますと、データサイエンティストになるためには学識を備えている必要があるという意味で、大学や大学院での学習は必要です。もちろん文系学部出身で企業に入ってからデータサイエンティストの勉強をした、という事例もありますが、やはり稀です。大学の4年間もしくは2年間で学習する情報処理や統計の知識が身につけると、就職してからも非常に大きなアドバンテージとなります。
実際に、データサイエンティストと一口にいっても活躍の場は多岐にわたります。統計学や情報処理などのいわゆる「情報科学系」だけでなく、目的に沿って正しいデータの運用ができるように整理をするデータエンジニアリング、さらには研究やビジネスにおいて何が問題かを把握しその課題を解決する「課題解決能力」などがあります。在学中に全ての能力を身につける必要ないですし、現実的ではありませんが、自分がどの分野で、どういった場面で活躍をしたいのかということをイメージすることによって、大学での学びがさらに深まることが期待できます。
データサイエンティストにも分野がある
データサイエンティストとは、一言でいうとデータサイエンスを修めた者ということですが、データサイエンスにもいくつかの種類があります。今回は大きく分けて機械学習、深層学習、強化学習の3つに分類をしています。
機械学習
機械学習とは、与えられた情報をもとに学習し、法則やルールを一時的に見つけ出すことができるプログラムのことです。大量のデータで人間にはわからないのでも、コンピューターが共通する法則性を見つけ出すことが可能となります。機械学習の一例としては、迷惑メールの自動判別化です。機械学習を使ってメール情報を大量にインプットさせることで、マニュアルで操作しなくても、勝手に判別してくれます。異なる色のりんごを大量にインプットさせることで、色を自動に判断してくれるのも、機械学習です。
深層学習
深層学習とは機械学習をさらに発展させたものになります。
例えば、先ほどの色の異なるりんごについて考えてみましょう。機械学習では、人間が「色ごとで分けたい」という目的のため、そのような目的に沿ってコンピュータを動かしていましたが、深層学習では、たくさんのデータを見せることによって「目の付けどころ」をコンピュータに学習させ判別をさせます。コンピュータが大量にあるデータの中で法則性を判断し、それを導き出すということです。目の付けどころを自動的に見つけ出す点において機械学習とは異なります。
強化学習
強化学習も、機械学習の一つと捉えられていますが、内容はさらに発展した内容です。
大量のデータインプットにより、価値を最大化できるような行動も自ら学習するものです。例えば株の売買を例にとってみましょう。価値を最大化する=長期的に自分の資産増やすということが正解だとした場合、どのようにしたら利益が最大化されるかという問題が強化学習です。持っている株を今すべて売ってしまえば、現時点でのキャッシュは最大化されますが、より長期的な目線に立つと株をもう少し持っておいた方が利益になる可能性があります。人間すら分からない答えに対して、コンピュータに予測させようというのが強化学習です。
機械学習全般を扱う大学、大学院の研究室
データサイエンティストを志望する学生のために、機械学習、深層学習、そして強化学習に関連する研究をしている教授をご紹介します。詳しい内容については、実際に大学のホームページを確認してください。そして、ここに取り上げたのは一部の大学に過ぎず、この他の大学や研究室以外にもデータサイエンスを勉強できる研究室は全国にあります。
機械学習に強い大学、大学院の研究室
東京大学
東京工業大学
早稲田大学
神戸大学
京都大学
深層学習に強い大学、大学院の研究室
東京大学
早稲田大学
京都大学
東京電機大学
強化学習に強い大学、大学院の研究室
東京大学
明治大学
法政大学
立命館大学
まとめ
いかがでしたでしょうか。データサイエンティストは名前がカッコよく、その格好良さゆえに惹きつけられてる人も少なくないのではないでしょうか。
この記事で少しでもデータサイエンティストとはどんな職業なのかが、データサイエンティストとしてどの産業のどんな職種に携わりたいのかを、具体的に考えるきっかけとしていただけたら幸いです。その上で大学や大学院を考えるときは、上記にリストアップした研究室を参考にしてみてくださいね。
そして最後に番外編として、海外の大学の研究室をご紹介します。 最新の研究分野を、英語で勉強したいという方は、海外の大学院も考えてみてはいかがでしょうか。
また、データサイエンティストは大学に行かなくてもなることができます。
経験者の人は、【未経験可】データサイエンティスト向けのおすすめ転職エージェントの比較!AI、機械学習エンジニア領域が強いのはどこ?の記事を参考にしてみてください。
未経験者、スキルに自身がない人はプログラミングスクールに通うとデータサイエンティストになることができます。【2019年完全保存版】データサイエンティストにおすすめのプログラミングスクール10選!AI・機械学習が学べる!の記事がおすすめです。
番外編〜海外大学の研究室〜
英語の情報サイトを中心に、以下の16個の大学の大学院(Master’s Degree)で機械学習のコースがあることがわかりました。機械学習はアメリカで一番発達している学問ですので、 海外の大学院で研究室への進学を志望している人は、アメリカへの留学を最初に考えるべきでしょう。 それぞれの大学の詳しい研究分野に関しては、ご自身でホームページから確認をしてください。
- Carnegie Mellon University
- University of Michigan Ann Arbor
- Cornell
- Berkeley
- Stanford
- Columbia University
- University of Washington
- Georgia Tech
- University of California San Diego
- University of Massachusetts Amherst
- John Hopkins University
- University of Illinois Urbana Champaign
- Penn State University
- University of North Carolina Chapel Hill
- California Institute of Technology
- University of Wisconsin Madison