数理・データサイエンス・AI教育の紹介

滋賀大学の数理・データサイエンス・
AI教育プログラム

竹村 彰通(滋賀大学 学長)

椎名  洋(滋賀大学 データサイエンス学部長)

1.はじめに

 本稿では本学における数理・データサイエンス(DS)・AI教育について述べます。まず2021年度に開始されたこの分野の認定制度の背景と、リテラシーレベル認定への本学からの申請について説明します。その後、本学データサイエンス学部のカリキュラム、大学院データサイエンス研究科の教育方針、企業・自治体との連携、データサイエンス教育の拠点としてのコンテンツの全国展開の推進、について述べます。

2.数理・データサイエンス・AI教育プログラム認定制度の創設

 数年前からアメリカや中国と比較して、我が国が数理・データサイエンス・AI分野で大きく遅れていることが強く認識されるようになりました。2017年4月には日本初のデータサイエンス学部が本学に開設され、その後毎年のようにデータサイエンス系の学部の新設が続いています。
 政府においては、2019年度に「AI戦略2019」が定められ、この分野の大学教育の強化が推進されることとなりました。図1はAI戦略2019に示されたものですが、リテラシーレベル(年間50万人)、応用基礎レベル(年間25万人)、さらにはエキスパートレベル(年間2,000人)の3つのレベルの育成目標が示されました。また、リテラシーレベルと応用基礎レベルにかかわるものとして認定制度・資格の活用があげられ、大学等の優れた教育プログラムを政府が認定する制度を構築するとされました。

図1 AI戦略2019に示された教育改革

 この方針に基づいて2019年10月に内閣府に「数理・データサイエンス・AI教育プログラム認定制度検討会議」が設置され、半年の審議の後2020年3月にリテラシーレベルに関する報告書[1]が出されました。そして、この報告書に基づいてリテラシーレベルの認定の募集が2021年春に始まりました。
 検討会議は2020年度にも継続され、応用基礎レベルの認定制度が検討され、2021年3月に応用基礎レベルに関する報告書[2]が出されました。これに基づき2022年の5月には応用基礎レベルの認定制度の募集が進んでいます。
 筆者の一人である竹村は2年間にわたり検討会議の委員として制度設計の議論に加わりました。その議論の中では、認定制度の内容やレベルをどのように設定するか、また変化の速いAIをどう扱うかについて熱心な議論がおこなわれました。特にリテラシーレベルは、大学の教養教育として大学生全員が学ぶことを目指すため、各大学において文系の学生でも興味を持って学べるようなカリキュラムの整備が重要であるという議論がなされました。また社会におけるこの分野の技術の活用の具体例を示すことによって、学生がまずこの分野の重要性を認識し、この分野に興味を持つことが大事であることが強調されました。
 リテラシーレベルに続く応用基礎レベルは年間25万人を目標しており、その対象は大学における理系学部のほぼ全員と、文系学部でも経済学部の一部などデータを扱う分野の学生を念頭におくものとされました。応用基礎レベルは専門教育において学ぶものであり、「AI×専門分野」という考え方で、それぞれの専門分野の学びと数理・DS・AIの学びをかけあわせて、各専門分野で数理・DS・AIの手法や考え方を活かしていくものとされました。このためには、数学・統計やプログラミングなどの技術的な基礎も重要であるため、応用基礎レベルではこれらの技術的な要素も各分野の必要に応じて学ぶことが求められています。またプロジェクト型の演習において数理・DS・AIの手法を実際に経験することも重要とされています。

3.本学からのリテラシーレベルの認定申請

 本学では2021年春のリテラシーレベルの認定に申請しました。本学の教育プログラムは認定を受けることができましたが、さらに優れた取組みとして「プラス認定」を獲得することができました。2021年度に認定を受けたリテラシーレベルの教育プログラムは78件ですが、その中で先導的で独自の工夫・特色を有するものとして認定された「数理・データサイエンス・AI教育プログラム(リテラシーレベル)プラス」は11件でした。
 本学ではすでにデータサイエンス学部において数理・DS・AIの専門的な教育をおこなっていましたので、データサイエンス学部としては申請の準備は十分整っていたのですが、リテラシーレベル申請で重要なのは大学生全員への教育の観点であり、学部単位ではなく大学としての申請が求められるものでした。しかも、申請時点で履修人数など一定の実績が問われるところが課題となっていました。
 幸い本学では2020年春に教養科目の見直しをおこない、自然科学分野の数理・データサイエンス・AI領域の科目群を設定して、「データサイエンスへの招待」の提供を始めていました。そして2021年春からは科目名を「データサイエンス・AIへの招待」と変更しました。この科目はデータサイエンス学部以外の学生が履修できる科目であり、これにより申請に必要な履修者数も十分に確保できました。
 さらに位田驤齣O学長のリーダーシップもあり、2022年度からはこの科目を経済学部及び教育学部で必修とすることとし、データサイエンス学部の入門講義とあわせてプログラム履修率を将来的に100%とする申請としました。これにより、本学の申請は高く評価され、プラス認定を受けることができたと考えています。
 全学でリテラシーレベルの教育を必修化するためには教材の整備が必要です。「データサイエンス・AIへの招待」の教材としては、データサイエンス学部で作成したmooc教材である「大学生のためのデータサイエンス(T)」を利用しています(図2)。

図2 リテラシーレベルのmooc教材
 また教科書としては、データサイエンス学部教員による「データサイエンス入門」を刊行しています。この教科書は2019年2月に刊行したものですが、2021年3月にはAI関連及び情報倫理関連の内容を追加して第2版を発行しました(図3左)。この教科書は他の大学の教育へのカスタマイズにも対応しており、2022年3月には長崎大学データ科学部との共著として「データサイエンスの歩き方」(図3右)を刊行しました。

図3 滋賀大学教科書 長崎大学との連携版

4.データサイエンス学部のカリキュラム

 「数理・データサイエンス・AI教育プログラム」への関わり方は、各大学において様々です。特に、理系学部と文系学部の割合がどうなっているか、理系学部の中に情報系・DS系の学部があるかどうかは、実際にどのようなカリキュラムが設定されるか、そして、取組みの主体となる組織(学部・学科)はどこかといった点に大きく影響します。
 本学では、2017年度に日本で最初のDS系学部である「データサイエンス学部」が設置されるまで、長らく経済学部と教育学部の二学部からなる、文系色の強い大学でした。今回の「数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)」への応募にあたっては、当然のことながら、データサイエンス学部の教育プログラム、そしてそれに基づく教育の実践成果が参照され、その実績が評価されたこともプラス認定につながったと考えています。以下では、データサイエンス学部において、どのようにカリキュラムが構成され、どんな形で実践されているかを紹介します。
 そもそもデータサイエンスという領域が何を含むのかという点に関しては議論のあるところです。日本においても、DS系の学部が徐々に増えてきていますが、各大学において学部の名称も異なり、(「データサイエンス系大学教育組織連絡会」(http://lcDSj.jp/))に参加している大学を例にとると、本学、立正大学では、「データサイエンス学部」、長崎大学では「情報データ科学部」、兵庫県立大学では「社会情報科学部」、群馬大学では、「情報学部」、2023年度開設予定の一橋大学では、「ソーシャル・データサイエンス学部」)、カリキュラムにおける力点も異なります。しかしながら、多くの大学で、データエンジニアリングとデータアナリシスという二つの分野がカリキュラムに織り込まれています。本学データサイエンス学部においても、この二つの分野が柱となっているのですが、この二つの分野の知識の学習にプラスして、それを用いて課題解決、価値創造を行うことが、もう一つの重要なカリキュラムの柱になっています。
 図4で説明します。まず、左端の柱は、データの収集・加工・処理を扱うデータエンジニアリング分野の学習です。これは、従来の情報学分野の一部に相当します。データがいかにして生まれるかを理解し、そのデータをどのような方法で収集すればよいかを学びます。また、得られた多様な形のデータをどのように加工処理し、保存すれば、有益な情報獲得につながるかを理解することも、重要な学びの一部です。

図4 データサイエンス学部の教育
 真ん中の柱は、収集されたデータを分析・解析する、データアナリシス分野の学習です。これは、従来の統計学の分野に該当します。グラフ・表を使った基礎的な分析から、複雑なモデルを使用した分析まで、また汎用的な統計手法から、特定の種類のデータに特化した分析方法まで幅広い学習を行います。
 データエンジニアリング、データアナリシスの両分野においては、プログラミングの知識は必須です。データサイエンス学部では、R、Python等を早い時期から学習し、これらを自在に使いこなせる能力を身につけるような教育を行っています。これら二つの分野は、いわゆる理系分野に属しており、数学の素養も必要になるために、大学理系教養レベルの数学を初年度の内に学ぶようにしています。
 最後の柱は、価値創造ですが、データを苦労して集め、解析するのは、そこから何らかの発見・創造をするためだということを、学生に理解してもらうために、学部で意識して教育していることです。価値とは極めて抽象的な言葉ですが、人を幸せにする何かと定義すれば、それを考えることは、きわめて文系的な営みになります。データサイエンス学部が文理融合を掲げ、入試においても文系の学生に門戸を開いているのは、価値創造局面での活躍を期待しているからでもあります。
 このカリキュラムの構造を別の点から見てみましょう。図5を見てください。先ほどデータアナリシスは、従来の統計学分野に該当するという説明をしましたが、統計学は、古くからある学問領域であり、例えば英国の王立統計学会(Royal Statistical Society、RSS)は1834年に設立され、日本統計学会も1931年に創設されています。日本には、統計学部は存在しませんでしたが、多くの大学で統計学は学習されてきました。データに基づいて何らかの実証をする際に欠かせない道具として、その重要性は認識されていましたが、あくまで手段・手法としての位置づけであり、各学部・学科に対応する専門領域の学習が進むにつれて、必要な時に学習するものという位置づけでした。各分野においてデータ分析の学習の必要性は認知されていても、時間がないので必要最低限の内容ですませる、場合によっては、学生が独学で学ぶというようなことが多々ありました。図5の左側の図が、このような学びかたを示しています。アルファベットのTの字の形で、真ん中の太い部分が専門領域の学習、細い横軸がデータ分析の学習という教育構造になっていたと言えるでしょう。

図5 逆Π字型の学び
 それに対して、全国で初めてDSを教育の主軸にすえたデータサイエンス学部では、DSの専門知識とスキルを本格的に学習し、それを利用して価値創造にトライするという教育方法をとっています。図5の右側が、この教育方法に相当します。本体・土台としてのデータエンジニアリング・データアナリシスを学び、それを実社会のデータに応用して、価値発見・創造にトライするという、パイの字を逆にしたような形の教育を行っています。実際には、早い時期から価値創造の局面も経験するカリキュラムになっていますので、逆パイの字教育の反復ということになります。
 現段階で、データサイエンス学部から一期生・二期生を卒業生として送り出していますが、情報産業(通信、IT、コンサルティング、メディア)のみならず、製造業・金融業・建設業等、幅広い業種に就職しています。このことは、DSが現代社会で普遍的な有用性を持っていることの一つの証と考えられます。

5.大学院(研究科前期・後期課程)

 今回の「数理・データサイエンス・AI教育プログラム(リテラシーレベル)」認定制度は、文系・理系を問わないすべての一般大学生に対する教育が対象となっており、これはデータサイエンス学部でいうと一年生レベルの教育にあたります。さらに現在、上のレベルの「応用基礎レベル」での認定制度が始まっており、本学(データサイエンス学部のカリキュラムが中心)でも応募のための準備をしているところですが、DS専門学部としては、より上のレベル(「エキスパートレベル」)の学生を送り出すことも大事な任務です。エキスパートレベルの人材を育成するために、2019年度に大学院の修士課程(博士前期課程)(定員20名)を、2020年度には博士課程(博士後期課程)(定員3名)を設けました。博士前期課程への入学希望者が年々増えていることから、2021年度からは定員を40名に増やしています。現在、博士前期課程の学生は、三つのグループから構成されています。データサイエンス学部からの内部進学生が15名から20名ほど、他大学の学生が10名ほど(その多くは非DS系の学部の出身です)、企業派遣・社会人の学生が15名から20名ほどです。
 本学のデータサイエンス研究科に内部進学する学生は、一種の「リピーター」であり、データサイエンス学部の教育成果に対する評価指標になると考えています。工学系の大学院では、学部の半数以上が大学院に進学するケースも稀でありませんが、文理融合学部であるデータサイエンス学部で、そのリピーター率が一割近いことは、それなりの評価であると考えています。内部進学生は、図4の最後の柱である「価値創造」の局面において、当該データが生み出される環境の知識(「領域知識」といういい方をします)もある程度勉強する機会がありますが、4年間の多くの時間は、最初の二本柱(データエンジニアリング、データハンドリング)の習得に費やされています。それに対して、他大学の非DS系学部出身者や企業派遣の学生は、体系的なDSの知識には欠けていても、学部や会社で身に着けた領域知識が豊富であり、具体的な課題やデータが常に念頭にあり、データ取集・解析の実践経験も豊富です。三つのグループからなる大学院生がお互いのグループ内だけでなく、グループの枠を超えて交流を深め、学問的にも啓発しあう、場合によっては起業に結びつくというような状態になるのが理想的ですが、残念ながらコロナ禍の影響もあり、このことはまだ道半ばです。
 コロナ禍に関連して、大学院の入試・授業のオンライン化についても触れておきます。この二年で、データサイエンス研究科の入試(面接)はすべてオンラインになり、授業のほとんどが、オンラインによる受講が可能になりました。このことは、時間の融通が利きにくい社会人大学院生にとっては、特に大きな便宜であり、一方で、大学院に在籍しなくても、大学院の授業の一部を聴講して勉強するということを可能にしてくれました。社会人のリスキリングは、これからの日本の教育界にとって重要な課題ですが、本学データサイエンス研究科も、この課題解決に積極的に寄与することができると考えています。

6.企業・自治体との連携

 大学と外部組織(企業・自治体)との連携については、様々な形がありますが、これについて、1)大学での教育における連携、2)外部組織の人材育成における連携、3)共同研究・コンサルテーションの3つについて、データサイエンス学部での取組みを紹介します[3]

1)大学での教育における連携

 データサイエンス学部の教育の一つの特徴は、企業・自治体等との連携にあります。価値創造の局面では、企業・自治体で何が課題・目標となっているかを知ること、どんなデータが実際に存在するのか、そしてそれを利用して企業・自治体でどのような価値創造が行われているのか理解することが重要です。また、データエンジニアリング・データアナリシスにおいても、リアルなデータ、つまり異常値・欠損値を含むデータや構造化されていないデータ等に取り組むことは大事な学習の一部です。
 データサイエンス学部は、多くの企業・自治体と、人材育成に関して協力関係にあります。様々な分野の企業・自治体から、多様な種類のデータを提供していただき、それを教育に活用しています。そこでの学習の成果を、企業・自治体の方からコメント・批評をいただき、場合によっては、学生の価値発見・創造を現場で生かしていただくという形のプロジェクトもいくつか進行中です。また、急速な勢いで変化するデータサイエンス利活用の現場の状況を、企業から招聘した講師の方々に、座学・実習・現場訪問を通して教えていただく授業も展開されています。

2)外部組織の人材育成における連携

 DSやAIに詳しい人材が日本において極端に不足していること、そしてその人材の育成が急務であることは、冒頭で述べましたが、最近でも様々な報告書や調査結果(例として、「デジタル人材の育成・確保にむけて」デジタル田園都市国家構想担当大臣2022年2月や、「2021年企業向け調査」データサイエンティスト協会2022年4月)で語られています。この社会情勢の中でDSを学ぶことは、社会人のリスキリングの有力な選択肢の一つであると言えますが、データサイエンス研究科も先に述べましたように、毎年15名前後の企業派遣の生徒を受け入れています。一般枠で、勤務先を辞めて入学した人も含めますと、毎年20名近くの人が、リスキリングのために入学している状況です。
 一方で、企業としては、もっと多くの人により短期間でDSの知識を身につけさせたいという要望も多く、本学では「データサイエンス・AIイノベーション研究推進センター」が中心になり、企業での社内研修を行っています。分野も、製造業、医薬系企業、金融系企業と多岐に亘りますが、それぞれの分野で頻出する課題解決に向けた実践的な研修を行っています。
 データサイエンス研究科の講義の一部を聴講(場合によっては、その後に補講を追加)する形で、社員教育を行っている企業もあります。今後は、いわゆる「マイクロ学位」の普及が、社会人のリスキリングとともに進んでいくと思われますが、そのために大学側もオンライン授業を整備して、社会人が使いやすい形にしていくことが重要かと思われます。
 一方、先に紹介しましたように、データサイエンス学部では、様々な教科書・MOOC教材を作成しています。こうした教材は、いくつかの大学で、教科書に採用され、オンライン教育用の教材として活用されていますが、一方で社内研修用に購入する企業・自治体も年々増えています。

3)共同研究・コンサルテーション

 企業・自治体との共同研究やコンサルテーションも、「データサイエンス・AIイノベーション研究推進センター」で行っています。共同研究やコンサルテーションの契約締結にいたらないレベルの相談件数も含めると年に数十件に上り、内容的にも、企業の喫緊の課題解決を目指したものから、長期的なスパンの共同研究まで様々なものがあります。後者の場合は、会社との共同研究センター設立に至る場合もあり、現在は学内にスペースを置くセンターが2つ稼働中です。これらのセンターでは、学部学生、大学院生が、研究やデータ研磨作業等に参加しており、一種のインターンシップとしての機能も果たしています。

7.数理・DS・AI教育の全国展開の推進

 文部科学省の懇談会で、数理およびデータサイエンスの教育強化策がまとめられ、その中心的な役割を果たす拠点校として、本学を含む6つの大学が選出されました。2017年度から2021年度まで、協力校・連携校とともに全国的なコンソーシアムを形成し、モデルカリキュラムの策定や各種教材の作成などを行ってきました。その第二期の活動として、2022年度からは、「数理・データサイエンス・AI教育の全国展開の推進」が開始され、本学は引き続き拠点校(11校)に選ばれました。リテラシー、応用基礎レベル教育の普及・展開はもとより、エキスパートからトップレベルの育成までが拠点校に求められています。
 第一期の活動の中で、本学のデータサイエンス学部で作成された教材についてここで紹介します。一つは、MOOC教材のシリーズで、図2で紹介した「大学生のためのデータサイエンス」シリーズを(T)から(V)まで3本、「高校生のためのデータサイエンス」を1本作成しました。これらは、常時、本学の学生がオンデマンドで視聴できるようになっていて、リテラシーレベルの教育認定において、プラス評価を受ける一つの要因になっています。また、ドコモgaccoのプラットフォームを通して、一定期間は無料で公開しており、コロナ渦の中で、多くの方に利用していただきました。「大学生のための」と銘打っていますが、レベル的にはリテラシーレベルから各種機械学習の紹介・応用までを含んでおり、社会人教育に関しても様々な企業で活用されていることは前にふれたとおりです。
 教科書については、学術図書出版社より、データサイエンス大系のシリーズとして、これまで6冊子を発行しています(図3は、そのうちの1冊子です)。また、講談社のデータサイエンス入門シリーズでは、4冊子の本を出版しています。今後、これらのシリーズから、さらに出版を予定していますが、一方で、各大学で教科書として使いやすいような工夫として、パワーポイント資料の提供や、演習問題の配布等を検討しています。

8.おわりに

 本学の「数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)」が、プラス認定を受けた背景として、データサイエンス学部の取組みを、いくつかの視点から説明してきました。日本で最初のデータサイエンス学部が本学に生まれて、ようやく5年がたったところであり、日本全体でのデータサイエンス・AI人材育成の取組みは、まさに始まったばかりです。今後、様々な大学・企業・自治体等で、人材育成に関する試行錯誤が続くと思われますが、本学において先端的な取組みを行い、その成功・失敗の経験を社会に還元していくことが、一つの社会貢献になると考えています。

関連URL
[1] 「数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)」の創設について
https://www8.cao.go.jp/cstp/ai/suuri/ninteisousetu.pdf
[2] 「数理・データサイエンス・AI教育プログラム認定制度(応用基礎レベル)」の創設について
https://www8.cao.go.jp/cstp/ai/suuri/ouyoukiso.pdf
[3] 詳しくは、滋賀大学「データサイエンス・AIイノベーション研究推進センター(旧称:データサイエンス教育・研究センター)」の年報、「Data Science View」(https://www.ds.shiga-u.ac.jp/dscenter/about/#report)をご覧ください。

【目次へ戻る】 【バックナンバー 一覧へ戻る】