特集 データサイエンス教育を知る
竹村 彰通(滋賀大学 データサイエンス学部長)
2017年4月に日本初のデータサイエンス学部(定員100名)が本学に誕生しました。この学部は、現代社会に不可欠なデータ処理・分析と価値創造を担うプロフェッショナルであるデータサイエンティストを組織的に育成するための学部です。日本の国立大学としては最大規模の経済学部を有し、長年にわたり数多くの有能な経済人を送り出してきた本学は、第4次産業革命の推進やSociety5.0社会の実現を担うデータ分析人材が、我が国で極めて深刻な人材不足に直面している状況に対して、高等教育機関として初めて正面から立ち向かい、データサイエンティストを組織的に育成し、社会に送り出そうとしています。また、企業等との多様な連携を通して、データサイエンスの社会実装や企業内人材の高度化を後押しながら、同時にこの分野に今後取り組む後発の大学に対し教育プログラムやPBL (Project Based Learning) 演習などのコンテンツを提供し、我が国全体のデータサイエンス教育の水準を向上させ、我が国経済社会の発展に貢献していこうというチャレンジに取り組んでいます。
2019年4月には我が国初の大学院データサイエンス研究科も前倒しで設置し、更なる高度人材の養成にも取り組む予定です(設置申請中)。
今日、ICTの劇的な進化により日々刻々と生まれ集積される音声、画像、テキスト、センサーデータなどいわゆるビッグデータは豊かな経済的価値生み出す可能性を持つ新たな資源と考えられるようになってきました。ここ10年で社会の情報インフラは大きく変化しました。そのインフラを支える象徴的なデバイスはスマートフォンです。日本でも20代でのスマートフォンの普及率は95%に達しています。携帯の電波の届く範囲も拡大し、数年前からは地下鉄の中でもスマートフォンが使えるようになり、電車の中で本を読む人は少なくなりました。
このような便利さと引き換えに、人々の行動履歴は常時ネットワークに記録されるようになりました。フェイスブックなどのSNS(ソーシャル・ネットワーキング・サービス)への書き込みやグーグルなどの検索の記録はビッグデータとして蓄積され、機械学習の手法で分析され、個人向け広告などに用いられています。このようなビッグデータは「21世紀の石油」ともよばれ、データを制するものが世界を制すると言われています。
このようなデータ駆動型社会への変化はここ10年ほど続いてきましたが、2016年にAI(人工知能)“Alpha Go”がプロの棋士に勝利したことなどを契機に、我が国でもAIやIoTが急速に注目され、今やメディアに関連記事が掲載されない日はないという状況になっています。データ分析利用の高度化は、製造業のサービス産業化を含めシェアビジネスなど数々の新しいサービスを生み出し、ビジネスの新展開や人々の生活に大きく役立とうとしています。
データという21世紀の重要な資源を活かしたものが競争的優位に立つわけですが、そのためには「データ」と「データを活かす技術」の双方が必要となります。データだけあっても分析利用できなければ宝の持ち腐れになってしまいます。しかしながら、我が国ではデータを分析できる専門人材が圧倒的に不足しているのが現状です。 これには我が国の大学に統計学部がなく、欧米や韓国・中国と比較して、データ分析の専門人材を組織的に育成する体制がなかったことが大きく影響しています。統計学部・学科の数は、アメリカでは100以上あり、一部がデータサイエンス学部化しています。またイギリスや韓国では50程度、中国では300超の統計学部・学科があります。これに対し日本はこれまでゼロであり、データサイエンス学部は統計系学部としても日本初の学部です。
アメリカでは「統計家が最もセクシーな職業」とグーグルのハル・バリアン氏が語った2008年頃以降、急速に統計学(生物統計学含む)の学士、修士の人気が高まり、今なお増加傾向が続き、日本との差がさらに拡大しています(参考:アメリカ統計学会ニュース 2017年10月号)。
データサイエンス学部では、アドミッションポリシー、カリキュラムポリシー、ディプロマポリシーのいわゆる3ポリシーを定めて、育成する人材像を明確にしています。
アドミッションポリシーでは、文理融合型の人材に来てもらうことを目的として、次のような資質をもつ人の入学を求めています。
次に、カリキュラムポリシーでは教養科目、統計学、情報学、演習などによりデータサイエンティストになるためのカリキュラムの構成について次のように定めています。
最後に、卒業時までに習得を目指す力量としてデータサイエンスの基礎的スキルの他に、データサイエンティストとしての自立性を要求したディプロマポリシーを次のように定めています。
今日の我が国は、企業や行政、医療、教育などあらゆる領域で大量のデータサイエンティストが必要であり、またこの分野は変化や進化のスピードが速いことから、時代に即したより高度な人材を育てるための専門教育が不可欠です。本学は、一日でも早い専門的・組織的取り組みが日本社会の未来を確実なものとするとの観点から、統計学・情報学を中心にデータサイエンス教育研究拠点に相応しい専任教員24名(2018年4月現在。その他客員教員等9名)による教育・研究コミュニティーを創り、様々な領域のデータを扱い、研究を進める体制を構築するとともに、データサイエンス学部では独り立ちレベルの、また現在計画中の大学院データサイエンス研究科ではさらに高次のデータサイエンティストの養成に取り組むなど、国内最高水準のデータサイエンス教育研究拠点形成に挑戦し続けています。
データサイエンティストの育成には、①大規模なデータを加工、処理する情報技術(データエンジニアリング)と、②多様なデータを分析、解析する統計技術(データアナリシス)に加え、③ビジネスや政策など様々な領域における課題を読み取り、データ分析による知見を活かして様々な課題を解決していく価値創造スキルを身に付けることができるよう教育を進める必要があります。本学では、この価値創造スキルを身に付けるために、ビジネス現場の実際のデータを用いたデータ駆動型PBL演習を重視し、1年生からPBL演習教育を繰り返し行い、データを通じた問題解決の実践力を養う指導を行っています。
実際のビジネスや政策等の価値創造の現場で取り扱われるデータの多くは、人間・社会・企業の3領域におけるデータであり、データサイエンスの専門知識とスキルを応用してデータ解析を行い、領域科学の知見を活かして価値創造に挑戦するためには、文系・理系双方の知見が必要となります。この意味でデータサイエンスは「文理融合」領域だと言うことができます。
こうしたビジネス、政策、科学などの多様なフィールドの価値創造の成功体験を積むためには、さまざまな領域の企業等の実際のデータを分析するPBL演習を、フェーズを進化させながら繰り返すことにより、様々な手法を体験させ、分析能力の向上に役立たせていく必要があります。
本学は、国内最高水準のデータサイエンス教育研究の拠点形成に当たり、学部設置に一年先行して2016年4月に我が国初の「データサイエンス教育研究センター」を設置し、以下の4つの領域において先端的な教育研究活動を行っています。
① データサイエンス基盤研究
データサイエンスの基盤となる機械学習、最適化、人工知能など最先端の研究
② データサイエンス価値創造プロジェクト研究
企業や自治体等との多様な連携による各領域でのデータ利活用法の提供など社会実装の支援や企業等との共同研究推進による価値創造
③ データサイエンス教育開発
日本初の体系的なデータサイエンス教育プログラムやPBL演習教材・MOOCなど様々な教育手法の開発
④ データサイエンス調査・情報発信
ワークショップや国際会議等を通じた研究交流・情報発信
具体的な活動として、教育開発の分野では、MOOC形式のオンライン講座「高校生のためのデータサイエンス入門」を2017年8月に開講しました。この講座は、基本的なデータ分析に触れる機会を高校生に与えることを目的としています。講座では、インターネット上で容易に閲覧・取得できる公的データを使って、代表値の計算やグラフの作成、また二変量データや時系列データを分析するための方法を説明しています。またこの教材は、AO入試においても活用しました。
調査・情報発信については、2016年度には、アメリカの統計教育やシンガポールのデータサイエンス教育について調査を行いました。また本学国際シンポジウムWorkshop on Undergraduate Education of Data Scienceを開催し、そこでの議論を通してデータサイエンス教育研究の国際的ネットワークを形成しました。2017年度には、データサイエンス学部開設記念ワークショップを統計数理研究所と共同開催し、高等教育におけるデータサイエンス教育の新たな展開について議論し、PBL演習事例を紹介しました。さらに総務省統計研究研修所との連携活動の一環として、2016年度から自治体の職員を対象にした「データサイエンスセミナー」を開始するなど、様々な活動を展開しています。
データサイエンス教育研究センターでは、これらの活動の推進に当たり「外部連携」を重視し、データを利用したい企業・自治体、統計数理研究所、理化学研究所AIPセンター(革新知能統合研究センター)、総務省統計研究研修所、(独)統計センターなどの政府関係諸機関、データサイエンティスト協会やIT系企業、内外の大学や統計教育連携ネットワーク(JINSE)などと連携しています。中でも、体系的なデータサイエンス教育の質向上と価値創造への貢献という観点から企業との多様な連携を重要視しています。
企業連携として、教育面では、
などを行っていますし、また、研究面では、
などを行っています。
本学では、すでに50近くの企業と連携し、データサイエンス人材の育成連携や様々な共同研究、受託研究等を行っていますが、こうした企業連携は、データサイエンス教育の質向上にも多くの利点をもたらしています。すなわち、
などの利点です。
文部科学省は、2016年度より政府の第4次産業革命実現方針に沿った人材育成が急務との観点から人材育成総合イニシアチブを掲げ推進しています。このイニシアチブでは、初等中等教育での対応の上に、トップレベルの人材育成、データサイエンス学部のような専門人材育成のほか、社会全体としての取り組みを加速化しデータ時代に適応できる人材の層を厚くするとの観点から、高等教育で全学(全学部生)に対する数理・データサイエンス教育強化・リテラシー醸成の方針が打ち出されています。
本学は、データサイエンス教育研究拠点形成に先行して取り組んでいることから、2016年12月、文部科学省から高等教育における数理・データサイエンス教育強化を「先導的に貢献する大学」として、東京大学、北海道大学、京都大学、大阪大学、九州大学とともに全国6拠点の一つに選定されました。これらの拠点大学は、全学的な数理・データサイエンス教育機能を有するセンターを整備し、すべての学部生に対し関連教育を行い、産業活動を活性化させるために必要な数理・データサイエンスの基礎的素養を持ち、課題解決や価値創出につなげられる人材育成の実現を目指しています。
本学は、拠点大学の中でデータサイエンス学部という専門学部を有する唯一の拠点として、データから価値を引き出して社会やビジネスの課題を解決する文理融合的なアプローチを志向する日本に相応しい新しいデータサイエンスプログラムを既に展開しており、この分野の国内最高水準の教育研究拠点でもあることから、その成果の他大学への普及等も視野に様々な活動を進めています。
今年前半には昨年の「高校生のためのデータサイエンス入門」に引き続き、MOOC教材「大学生のためのデータサイエンス(Ⅰ)」を公開し、データサイエンス教育にお悩みの全国の大学で利用いただけるようにする予定です。
データサイエンス学部の学生は、入学後の2年間で、データエンジニアリング系科目(情報科学概論、計算機利用基礎など)やデータアナリシス系科目(基礎データ分析、線形代数など)を通して基礎知識を学修します。また、データ解析科目(基礎情報活用演習A及びB)で、統計的データ分析を行うための様々なツールの使い方を学修します。加えて、価値創造基礎科目(データサイエンス実践論A及びB、実践データ概論A及びBなど)を通して、様々な領域の専門知識に触れながら、それぞれの分野特有のデータ、解析手法、解釈の方法の特徴を理解し、多種多様なデータに対する姿勢を身につけ、データサイエンスの具体的な活用方法や価値創造のノウハウを学びます。
それらの基礎を身につけた後に、3、4年次では、データアナリシス専門科目(ベイズ理論、品質管理など)や価値創造応用科目(ファイナンス論、ファイナンス演習など)を通して、データサイエンスの分析方法を適用する実践的訓練の場において、様々な応用手法、技術とともに様々な領域の知識を身につけます。
さらに、学生は、1年次からデータ駆動型PBL演習(課題解決型学修)での経験を段階的に積み上げ、問題解決の様々な側面に触れます。連携先の企業から提供を受けた実際のデータを用いた課題に取り組む。このような演習を4年間積み上げることにより、分析のための専門知識(文字TやΠの横棒に相当)だけではなく、領域の幅広い知識(文字TやΠの縦棒に相当)も身につけ、それらを課題解決に活かすための実践経験を積んだ「逆T型人材」あるいは「逆Π型人材」を育成することとしています。
学生が様々な資格を取得することについてもカリキュラム上の配慮をおこなっています。情報処理技術者試験(基本情報技術者試験、応用技術者試験)、統計検定(準1級、2級)、品質管理検定(2級)については、これらの対応した講義を提供します。また、学生は所定の単位を習得することにより、社会調査士の資格を取得できます。
一般選抜の前期日程は、英語と数学の基礎的な知識・技能を重視する教科型です。数学の範囲は、数学Ⅰ、数学A[全範囲]、数学Ⅱ、数学B[(数列)と(ベクトル)]までの知識で受験可能なものとしており、文系の学生でも受験できます。
一般選抜・後期日程では。英語と、課題解決に向けた思考力・表現力を重視する総合・合科目型の問題を出題します。総合問題では、社会や日常生活での課題をとりあげた図や表を含む文章を素材に、表やグラフを読み取り、それらを用いてデータを分析し、分かったことをまとめ、その解釈について議論する能力を問います。
さらにアドミッション・オフィス(AO)入試では、課題発見・解決力、その基礎となる思考力・判断力・表現力、学ぶ意欲、そして価値創造への主体的姿勢等を含めた「実践的な学力」の総合評価を重視しています。2018年度入学者選抜試験からは、AO入試を次の3タイプに分けておこないます。
[AO入試Ⅰ]は、本学彦根キャンパスで開講するデータサイエンス講座の受講を必須とするAO入試であり、講座を受講後、内容に関するレポートを提出させます。[AO入試Ⅱ]は、データサイエンス学部が開発したMOOCの「高校生のためのデータサイエンス入門」の視聴を必須とするAO入試であり、出願時に、教材内容に関する課題レポートを提出させます。[AO入試Ⅲ]は、全国規模で開催されるデータ分析やプログラミングに関するコンペティション等への参加経験者を対象としたAO入試であり、出願時に、コンペティション等での実績報告レポートを提出させます。
どのタイプにおいても、統計質保証推進協会主催 統計検定(3級以上)、日本規格協会主催 品質管理検定(3級以上)、情報処理推進機構主催 情報処理技術者試験(各種)、全国商業高等学校協会主催 情報処理検定試験(各部門第1級)の取得資格を第1次選考の評価に含めることとしています。また最終選考では、大学入試センター試験の教科・科目の合計得点により最終合格者を決めることとしています。
2019年4月、本学はデータサイエンス学部完成年度を待たずに、大学院データサイエンス研究科(定員20名)を設置する予定です(現在文科省に申請中)。まだデータサイエンス学部卒業生がいない状況での設置であり、この大学院は、当面企業派遣学生を中心に受けいれる予定です。
育成する人材像は、「方法論とデータをつなぐ」価値創造人材であり、課題発見、データ選択・収集・研磨の前処理、分析モデルの決定、最適化計算、結果のプレゼンテーション、意思決定の変更・価値創造という一連の流れを自己のイニシアチブで実行できる高次のデータサイエンティストです。そのような人材を育成するため《モデル化の方法論+実課題による価値創造の実践》を重視した前衛的なカリキュラムを導入します。
この大学院は様々な業種の企業からデータサイエンティストとして嘱望される人材を派遣していただき、異業種交流によるオープンイノベーションの場となることを目指しています。
我が国初のデータサイエンス学部設置など本学のデータサイエンス教育研究拠点の形成には、我が国経済の発展に貢献する取り組みとして、政府や企業等からの多くの期待が寄せられています。
本学は、この文理融合の未来志向のチャレンジを通じて、若きデータサイエンティストの育成はもとより、企業内人材等の高度化、企業等との価値創造プロジェクトの推進、新たな分析手法の開発など、データサイエンスを通じて社会に大いに貢献する大学を目指し、トップランナーとしてさらに前進していこうと考えています。
データサイエンス学部1期生には、地元滋賀、中部圏、近畿圏のみならず、北は北海道から南は四国・九州まで全国各地から、統計やコンピュータを社会的な課題解決のために役立てたいという意欲を持った110名の若者たちが集まりました。データサイエンスや価値創造の基礎科目教育のほか、数多くの連携企業やデータサイエンティスト協会の協力を得て特別講義や実践演習、現実社会のデータを使ったPBL演習などの教育が着実に進められています。この春には108名の2期生も受け入れました。
彼らが社会からの強い要請を実感しながら、これからの時代を自ら切り拓くデータサイエンティストとして育ち、社会に巣立っていくことを念願しています。詳細は参考文献[1]を参照ください。
参考文献 | |
[1] | 竹村彰通 著 岩波新書「データサイエンス入門」2018.4 |
参考URL | |
滋賀大学 データサイエンス学部 | |
https://www.ds.shiga-u.ac.jp/ |