ベイズ統計・データ同化による現象予測を研究する明治大学 総合数理学部 現象数理学科の中村和幸教授。社会におけるデータサイエンスの有用性と、研究室での学生の成長などを聞いた。
必要なデータはどれ?集めたデータをどうまとめる?
コンピューターやAIの発展で、「データ」は益々その重要性と活用範囲を大きくしています。私たちが取り組んでいるのは、データを効果的に使い、日々の生活から科学的な発見まで、幅広く役立てるための研究です。
身近な例として、「気象予報」を取り上げてみましょう。
これまで「明日のお天気」が限界だった予測が、「1時間ごと」の「特定の範囲」で立てられるようになり、生活がより便利になりましたよね。これは気象庁のスーパーコンピューターで予測を行う際に、アメダスやレーダーの多量のデータを取り込み、予測をよりよくする技術が発達したことが貢献しています。この技術に「ベイズ統計」というデータサイエンスの方法が使われています。
気象予報以外では、放火が起こった現場の位置から犯人の拠点を予測したり、病気の検査の陰性・陽性結果の精度を計測したりと、様々な分野でベイズ統計が役立てられています。
このように応用範囲は幅広いのですが、実はしくみは共通です。まず、事前に知っていることをもとにコンピューターで予測計算できるようにします。しかし、コンピューター上での計算だけでは、あくまでも「ヴァーチャル」の世界での想定。そこに実際に起こった「リアル」なデータを組み合わせることで、予測の精度を高めていくことができるのです。また、精度の高い予測を立てるためには、より多くのデータがあるに越したことはありませんが、例えば天気予報のために、世界中のありとあらゆる場所に計測機を取り付ける…なんてことは現実的ではありませんよね。なので私たちは、「より正確な予測を計算するためにはどう計測機を配置するか」といった最適配置の研究もしています。
楽しみながら身につけた知識が、あらゆる分野に応用できる
研究室では、まず自分の興味を見つけることを大切にしています。
テーマを定めたあとに、どのようなデータを・どれくらい・どのように集めるか、研究の進め方を一歩一歩考えていくことになります。
例えばある学生は、ある「音楽ゲーム」をテーマに選びました。譜面に対して適正なレベル設定を行うためのルールを見つけることが目標です。譜面データ・レベルデータを収集し、配置されている音符の個数や操作タイミングの難易度を加味しながら、「どのような譜面だと、どのようなレベルになるのか」を探ったのです。さすがに私も当初は「研究として成り立つのかな?」と心配したりもしたのですが、参考になる研究なども見つかり、無事卒論を書き上げることができていました。
秋学期にテーマを決めた3年生は、週1日ペースで私とミーティングを行いながら、研究に取り組んでいきます。初めのうちは私の助言を必要としていた学生が、徐々に自走しはじめ、1年が経った4年生の秋学期になると、ほとんど自分の力で次のステップを定め、研究を進めている姿を頼もしく感じています。途中、就職活動期間を挟む学生もいますが、その間もうまく研究と就職活動を両立しています。ほとんどのゼミ生が早い時期に就職先を決め、その後また研究に集中して取り組むことができています。
世の中のあらゆる分野を横断できるのがデータサイエンス
データサイエンスは、以前から「統計学」「情報科学」の名で行われていた研究が、コンピューターの発展によってより多く・簡単に・コストも抑えてデータを蓄積できるようになったことで発展した分野でもあります。気象・農業・商業・医療等、分野を問わず役立てることができるため、私自身も企業や官公庁の方々と共同して研究に取り組んでいますし、研究室の学生も、希望により参加してもらっています。
データサイエンスの強みはまさにその点で、特定の分野でだけ活かせるものではなく、世の中のあらゆる分野を横断して活用できる点にあります。
現時点で自分の興味が明確な方は是非将来、卒論のテーマとして取り組んでほしいと思いますし、現時点で定まっておらず「データ分析に興味がある」程度だとしても、そこからあらゆる分野に発展させていくことができます。基本を大切にしながら大きな目標を見つけていきましょう。いま、高校の授業で習っている確率・ベクトル・微分積分が大活躍するところが見られますよ。
- 【募集人員の7割が一般選抜】
- 明治大学では、一般選抜(学部別入試・全学部統一入試・大学入学共通テスト利用入試)が、全体の募集人員の約7割を占めており、基礎学力を有する多くの受験生にチャンスがあります。奮ってチャレンジしてください!
-
受験生向けの「明治大学入試総合サイト」はこちら!
提供:明治大学