数理・データサイエンス・AI教育の紹介
平井 佑樹(信州大学 学術研究院総合人間科学系(全学教育センター)准教授)
統合イノベーション戦略推進会議で決定された「AI戦略2019〜人・産業・地域・政府全てにAI〜」[1]では、文理を問わずすべての大学及び高等専門学校生(約50万人/年)が、課程にて初級レベルの数理・データサイエンス・AIを習得することを求められています。また、これを踏まえた文部科学省の「AI戦略等を踏まえたAI人材の育成について」[2]では、小中高から大学及び高等専門学校における人材育成の取組が公表されています。
これを受けて、本学では信州データサイエンスプログラム[3]をスタートさせました。本プログラムでは、2023年度からの入学生を対象とする全学必修科目「データサイエンスリテラシー」を共通教育におけるオンライン形式で開講し、文理を問わず本学のすべての学生が社会におけるデータ活用、データリテラシー、データ・AI利活用の全般にわたって学習しています。また、自治体や企業等と連携して「信州」の特色を活かした学修も行っています[4]。
専門教育では、工学部において、データサイエンス(DS)、データエンジニアリング(DE)、AIの要素を融合した教育プログラムを実施することで、産業DXに資する人材育成を行っています[5]。また、教育学部、医学部、繊維学部では、各専門課程におけるDS、DE、AI要素の組込みや、地域・医療機関・教育機関が有する大規模データを活用したPBLを意識した教育を行っています。
本学は、文部科学省の「数理・データサイエンス・AI教育プログラム認定制度」(MDASH)[6]において、2023年に「リテラシーレベル」認定を受け、さらに2024年には「リテラシーレベルプラス」に選定されました。また、前述の工学部の取組が2024年度に学部単位で「応用基礎レベル」認定を受けました。ここでは、「リテラシーレベルプラス」に選定された取組について紹介したいと思います。
本プログラムの準備は、2019年度から開始しており、パイロット科目の開講と、本学の全学部が関わる各種委員会・会議での検討を並行して進めてきました。2020年度開講の「データサイエンスのための数をつかむ技術」、2021年度開講の「データサイエンス概論」(いずれも選択科目)を通じて、後述のオンラインテストを実運用しました。また、長野県内の自治体や企業と連携した「データから見る長野県ゼミ」を2021年度に開講し、現在も継続中です。
これらの準備を経て、2022年度にMDASHに対応させた科目編成を行いました(図1)。具体的には、全学必修科目「データサイエンスリテラシー」のパイロット科目となる選択科目「データサイエンス入門」を、統計やデータサイエンスに関連する既存の科目からの内容も加えた上で開講し、本プログラム(リテラシーレベル)をスタートさせました。2023年度からは、数理・データサイエンス・AI教育強化拠点コンソーシアムが発表したモデルカリキュラム(リテラシーレベル)[7]における「導入・基礎・心得」の内容は「データサイエンスリテラシー」で扱い、モデルカリキュラムの「選択」の内容は選択科目に位置付けました。
図1 科目編成の流れ
本プログラムでは各学部カリキュラムへの組み込みやすさや年度あたり2,000名程度(=本学1学年の学生数)を担当する際の教育効果を考慮して、データサイエンスリテラシーを1単位科目とし、完全オンデマンド型で実施することにしました。本科目の詳細については、文献[8]をご覧ください。
(1)科目編成
本科目は全8回で構成されます。前述のモデルカリキュラム(リテラシーレベル)と関連付けて科目を構成し、次のテーマ名で授業を行っています[9]。
- 第1回:【導入】データ駆動型社会とSociety 5.0
- 第2回:【導入・心得】データの増大する社会とAIの必要性
- 第3回:【導入・心得】オープンデータの活用と個人情報管理
- 第4回:【基礎・導入】1変量データから情報を得る方法の概説
- 第5回:【基礎・導入】2変量以上のデータから情報を得る方法の概説
- 第6回:【基礎・導入】図示による表現
- 第7回:【基礎・導入】数値による比較
- 第8回:【導入・基礎・心得】総括
本科目の達成目標は「データサイエンスの見方に沿って情報を捉えることができる。モデルカリキュラム『基礎』においては、データの図示の中に代表値や散布度などの統計量を読み取れる」です。これからの社会のあり方を考えてもらうなど、データサイエンスの基礎学習に不可欠な統計学、情報科学、数学の位置づけを理解してもらうような構成にしました。
そのため、本科目ではモデルカリキュラムにおける導入・基礎・心得の内容を網羅的に扱い、いわゆる文系学生でも無理なく学習することができるよう、資料の読解を中心とした構成としています。ただし、高等学校などでプログラミングの学習を十分に行っている学生がいる可能性も踏まえ、モデルカリキュラム「基礎」を扱う回では、成績評価に影響しない補助教材として、Google Colaboratoryで動作体験できるプログラムを提供し、プログラミングを通してデータの分析や可視化を理解してもらえるような機会も提供しています。
(2)開講時期と履修登録
本科目は各年度の前期または後期の前半に行うようにし、前半で単位を修得できなかった学生は各期の後半で再履修できるようにしています(図2)。また、本学7学部(人文(L)、教育(E)、経法(J)、理(S)、工(T)、農(A)、繊維(F))と2学科(医(M)[医]、医(M)[保])の計9部局それぞれに担当教員が1名つき、部局単位で教育・学習を進めるようにしています。すなわち、習熟度別にクラス分けをすることはなく、部局単位でクラス分けを行っています。これは、同じ部局内の学生であればデータサイエンス科目の動機づけとなる共通要素が大きくなり、受講の継続性に欠点を指摘されることの多いオンデマンド授業において、クラス全体への声かけの有効性が高くなることを企図したためです。履修する時期は各部局の意向によって決定しています。
図2 開講時期と対象学部
(3)課題と成績評価
成績評価に影響する課題は、「小テスト(70点満点)」、「記述課題(20点満点)」、「授業に対する質問やアンケートへの回答(20点満点)」の3つです。これらの満点を合計すると110点となり、60点以上で単位修得となります。110点満点としている理由は、本科目が完全オンデマンド型であることもありますが、自己管理がまだ十分にできず、小テストの受験や課題の提出を忘れる学生が出てくる可能性があるためです(本学ではおよそ9割の学生が一人暮らしをしており、大多数が入学してから初めて一人暮らしをしている)。つまり、受験忘れや提出忘れなどの失敗を1回したとしても、本学の成績の満点である100点を取れるようにしたためです。
小テストはすべてオンラインテストで、次の6点に示す方針に沿って問題を作成し出題しています。
- 答えが複数ある選択式問題を中心に出題し、数字のみの記入などを含め、記述式問題は一切出題しない。
- 当てはまるもの、あるいは、当てはまらないものをすべて選ぶ形式の問題とし、答えの数は伝えない。
- 解答に過不足があっても得点を与えることがある。
- (不正受験防止の観点から)各回の小テストの制限時間を5〜15分とし、受験可能回数を1回とする。
- (不正受験防止の観点から)採点結果のみ開示し、答えは開示しない。
- (不正受験防止の観点から)選択肢のシャッフルを行う。数値のみの入れ替えで済む問題については履修者ごとに与える問題を変える。
図3は、小テストにおいて実際に出題した問題の一つです。第1回から第7回ではこのような問題を毎回3〜5問出題し、各回10点満点の小テスト7回分の合計得点を評価に用いています。
図3 小テスト問題の例[8]
本学の共通教育科目は大きく「基盤系」、「教養系」、「専門基礎系」の3つに分かれています。前述の「データサイエンスリテラシー」も含め、本プログラムに含まれる科目は基盤系および教養系の科目として開講しています。詳細は、本学の全学教育センターで公開している共通教育履修案内[10]をご覧ください。
(1)基盤系科目
基盤系科目は、初年次教育を含む学問形成に不可欠な基礎的知識・能力を修得することを目的とした枠組みで開講しています。「データサイエンスリテラシー」以外では、2024年度時点で次の4科目を開講しています。
- 統計学からデータサイエンスへ
- 機械学習入門
- 質問紙調査入門
- 意外と長い人工知能の歴史
いずれの科目も2単位の講義科目であり、理論の概説を中心とした授業を展開しています。様々な道具を使った実験やグループ演習を行う科目もあり、1クラスあたり100名程度を限度として開講しています。プラス選定を受けた2023年度プログラムにおいては、延べ600名の受講者を基盤系科目で受け入れられるようにしました。
(2)教養系科目
教養系科目は、幅広い教養の修得と問題解決力・探求力を涵養することを目的とした枠組みで、2024年度時点で次の8科目を開講しています。
- ロボティクス実践ゼミ
- 高大接続におけるデータサイエンスゼミ
- データから見る長野県ゼミ
- データから白馬村の観光を考えるゼミ(ドコモ・白馬村連携講義)
- データからの地域課題発見ゼミ
- Web制作ゼミ
- プログラミング入門ゼミ
- 時系列データ分析ゼミ
いずれも科目名に「ゼミ」が付されており2単位の「演習形式の授業」を展開しています。これらの「ゼミ」では1クラスあたり30名程度を限度とした少人数教育を実施しており、プログラミング、課題解決型演習、フィールドワーク(写真1、写真2)、グループワークなど多種多様の学びを提供しつつ、「応用基礎レベル」への橋渡しの役割も担っています。プラス認定を受けた2023年度プログラムにおいて、教養系科目で延べ420名、前述の基盤系科目と合わせて延べ1,000名程度、つまり本学1学年の半数程度の受け入れが可能です。
特徴的な科目である「高大接続におけるデータサイエンスゼミ」(前期)では、高大接続に関わる「アドミッション専門人材」が行う業務に着目し、本学志願者に関係するデータをどのように利活用しているのかを学びます(写真1)。また、「データから白馬村の観光を考えるゼミ(ドコモ・白馬村連携講義)」では、白馬村の観光課題は何か、解決するためにはどうしていけばいいかということを、ドコモグループが保有する白馬村の観光に関するビックデータ及び白馬村からの話題提供をもとに、現地調査も行いつつ検討します(写真2)。
写真1 高大接続におけるデータサイエンスゼミ(前期)におけるフィールドワークの様子[4]。
写真2 データから白馬村の観光を考えるゼミ(ドコモ・白馬村連携講義)におけるフィールドワークの様子[4]。
(1)各期後半に開講する科目での学習支援
図2のように、「データサイエンスリテラシー」は、前期の前半あるいは後期の前半で実施しているため、たとえ前半で単位が修得できなかったとしても、履修した学期の後半で再履修できるようにしています。このように、短期間で挽回できる機会を設けるとともに、各期後半では、理解が進まなかった学生に対して集中的に学習支援を行えるようにしています。
(2)ITピア・サポート室員による学習支援
ITピア・サポート室(写真3)では、本プログラムの授業担当教員とティーチング・アシスタントが、オンラインで学習するための端末(コンピュータやスマートフォンなど)利用の不具合に関する質問対応から、プログラミングに関する相談への対応まで、幅広く学習支援を行っています。原則、平日の日中はいつでも利用できるため、多くの学生に対する相談を受け付けられるようになっています。
写真3 ITピア・サポート室員によるサポート
(3)ラーニング・アドバイザーによる学習支援
全学生を対象とする本学の中央図書館に設置されている「ピアサポ@Lib」[11]では、先輩学生がラーニング・アドバイザー(LA)として、学生からの各種相談に応じています(図4)。講義資料や演習問題に関する質問や、オンデマンドでの学習方法等について、学生目線で学習支援できるようにしています。
図4 ピアサポ@Libの紹介リーフレット[11]
2023年度からはデータサイエンスリテラシー対応のLAも配置するようにしており、2024年度においては、授業時間帯の後(概ね19時以降)でもサポートを受けられるようにしています。
本プログラム(リテラシーレベル)の修了要件は、「データサイエンスリテラシー」の単位を修得することです。そのため、2023年度以降に入学した学生全員がリテラシーレベルの素養を身に付けたうえで卒業することになり、「信州」の特色を活かした学修を終えた学生が社会へ羽ばたいていきます。
この「データサイエンスリテラシー」は、「長野県内高校生による科目等履修生(先取り履修生)」[12]用の科目として、また、地域活性化人材育成事業SPARC:「『しあわせ信州』を創造する地域活性化高度人材育成プログラム」[13]用の科目としても開講しています。このように、本学で教育している内容が高校生や他大学の学生にも伝わっており、本学での取組が普及していくことが期待されます。
2024年7月、本学は教育・学生支援機構にデータサイエンス教育推進本部を立ち上げました。今後は、現在工学部で認定されている応用基礎レベルに関する取組を参考にしつつ、大学単位での応用基礎レベルの認定を目標に活動していくとともに、大学院でエキスパートレベルの教育を実施できるように準備を進めていく予定です。