私たちはインターネットなどを介し、普通に生活しているだけで莫大なデータを記録されている。そうしたデータを活用し、より便利な社会を実現しようとする「データサイエンス」の重要性が飛躍的に高まっている。滋賀大学データサイエンス学部で教える竹村彰通教授に、文系理系を問わず必要なデータサイエンスの基礎知識を教えてもらった。 (木和田志乃)

 

スマホ広告の裏側は

――データサイエンスとは何ですか?

近年、情報通信技術の発達により、インターネットにさまざまなデータが蓄積されるようになりました。例えば、コンビニエンスストアでは「どんな商品が何時にどれだけ売れたか」によって仕入れの量を調整します。さらに購入者がポイントカードやスマホ決済を利用していれば、性別や年齢も分かります。それらの情報を組み合わせて、特定の消費者に向けた商品を開発することができます。

高校生の皆さんも、検索した言葉や興味を持った商品に関連する広告、ニュースがスマホに表示されることは日々経験していると思います。大規模なデータを処理し、分析し、活用していく学問分野がデータサイエンスです。

日本は活用に遅れ

――どんなことに生かせますか?

例を挙げると、スマホやGPSの普及で車の移動先などの行動範囲が分かるようになり、商品を配送する効率的な経路の選定に生かされています。購入者の情報は、キャンペーンに付ける景品を選ぶときなど広告宣伝に役立ちます。人口変動のデータは、保育園の設置場所などの公共政策や金融・保険商品の開発に反映されています。その他、医療、健康、観光、教育のさまざまな分野で生かされています。

一方、Amazonなどのアメリカ企業、最近では中国の企業と比較すると、日本はデータの活用が遅れています。例えば改札の自動化のために導入されたICカードに鉄道の利用データも蓄積されているのに活用しきれていません。未活用の分野も多いため、今後はデータに基づいた合理的な提案がこれまで以上に求められるなど、大きな可能性を秘めています。

読み書きと並ぶ基本

――データを扱うには、どんな知識が必要ですか?

試験の成績から短距離走の記録、身長や体重、気温、人口の増減まで、私たちの生活にはデータが深く関わっています。データ処理のツールを作り、分析するためにはプログラミングや統計学、数学など、理系の専門知識が必要です。今は多くの使いやすいツールもあります。

しかし、ツールに数字を当てはめていくだけでは、間違った結果が出ても気付かないことも。普段から数字が何を意味しているのか考えることが大切です。

――データサイエンスの素養を身に付けるには?

高校生の皆さんも今のうちから読み書きと同じようにデータを扱うことに慣れてください。データ処理の最も基本的なツールであるエクセルは、多くのパソコンにインストールされています。こういったツールを利用して試験の成績や体重などを記録し、比や割合、数量的なイメージを持ち、数字が持つ意味を考えてください。これこそがデータサイエンスの第一歩です。

また、ものを買う時にどのようなデータが集められ、どのようなサービスに使われているのか想像する視点を持つことも大切です。人間を対象にしたサービスや社会の課題を解決するためにデータを利用するという点からは社会的な関心が必要です。

竹村彰通教授

 

たけむら・あきみち 1952年生まれ。東京藝術大学音楽学部附属音楽高校卒業。東京大学大学院経済学研究科理論経済学・経済史学専門課程修士課程修了。滋賀大学データサイエンス学部長。専門は数理統計学。主な著書に『データサイエンス入門』(岩波新書)。