特集 数理・データサイエンス・AI教育の紹介
史 一華(西南学院大学 商学部教授 情報処理センター所長)
井手 順子(西南学院大学 人間科学部准教授 データサイエンス教育主任)
新原 俊樹(西南学院大学 情報処理センター助教)
近年、社会の様々な分野でAIやビッグデータの本格的な活用が進む一方、これらの技術を活用できる人材が不足しており、この分野で活躍できる人材の早期育成が課題となっています。この対策として政府が策定した「AI戦略2019」[1]では、大学等の学生が初級レベルの数理・データサイエンス・AIに関する知識を修得すること(リテラシーレベル)や、文系理系を問わずこれらの知識を自身の専門分野に応用できる基礎的な力を養うこと(応用基礎レベル)が目標に掲げられています。
これを受けて、本学も2020年度から従来の情報処理教育カリキュラムの見直しに着手し、2021年度には文部科学省が推進する数理・データサイエンス・AI教育プログラム認定制度(以下、「MDASH」)のモデルカリキュラムに準拠した全学共通の4科目(「データリテラシー」、「データサイエンス基礎(データ分析)」、「データサイエンス基礎(AI活用)」、「データサイエンス実践」)で構成される「数理・データサイエンス・AI教育プログラム」を提供することを決定しました。その後、本プログラムの実現に向けて関係規則の整備や教員の任用を行い、2022年度からは教材の作成やティーチングアシスタント(TA)を活用した統一的な支援体制の構築を経て、2023年度から本プログラムを構成する各科目を開講しました。
本プログラムは、2024年8月にMDASHの「リテラシーレベル」と「応用基礎レベル」の認定を受けたほか、先導的で独自の工夫や特色を持つ取組として「リテラシーレベルプラス」にも選定されたところです。本稿では、人文社会科学系の7学部を擁する本学の特性を踏まえた本プログラムの設計と教育上の工夫について報告します。
本プログラムでは、人文社会科学系大学としての本学の特性を活かし、独自の12項目にわたる工夫や取組を展開しています。これらの取組について、プログラム構成科目の授業内容(1〜4)、プログラム修了を目指す学生への学習支援(5〜9)、地域・産業界・大学等との連携(10〜12)の3つのカテゴリーに分けて紹介します。
(1)データ分析の手段を選択できる科目編成
文系学生が主専攻に加えて無理なくデータサイエンスを学び、プログラム修了を目指せるように、プログラムの創設に合わせて新たに4科目を開講しました。この4科目はMDASHモデルカリキュラムの学修内容を無駄なく網羅するように設計されており(図1)、シンプルな構成になっています。リテラシーレベルでは、全学必修科目の「データリテラシー」(2単位)を履修することが求められます。応用基礎レベルでは「データリテラシー」に加えて「データサイエンス基礎(データ分析)」か「データサイエンス基礎(AI活用)」のいずれか(2単位)、合計2科目4単位を取得することで修了要件を満たすことができます。
図1 西南学院大学のプログラム構成科目
データ分析の手段についても段階的な学習が可能になっています。リテラシーレベルでは、社会で広く利用されている表計算ソフトを用いた分析手法を学習します。次の応用基礎レベルでは、複数のプログラミング言語(RやPython)のいずれか、または両方を選択して学習する機会を提供しています。さらに、エキスパートレベルの科目ではBIツールも活用し、学生が自身の習熟度や興味に応じてデータ分析の手段を選択しながら学習を進められるように工夫しています。
(2)21種類の実データを活用した授業
応用基礎レベルの2科目では、Kaggleに加え企業等から承諾を得て入手した21種類の実データを活用し、実社会で生じる課題の解決能力を育成する授業を展開しています[2]。データサイエンスが身近な課題の解決に役立つことを学生に実感してもらうため、プロスポーツや芸能、SNSを題材としたデータを活用し、学生の関心を引き出す工夫もしています。
例えば、大学在学中に一度は経験する国政選挙を題材としたデータ分析の事例では、「政党が多すぎて違いがわからない」という学生の疑問に応える形で、2022年参議院選挙の候補者アンケート結果[3]をもとに各候補者の政策的主張の違いを可視化しました。さらにクラスター分析によって立場が近い候補者をグループ化し、複雑な情報を整理・理解する方法を示しました(図2)[4]。このように、学生目線で感じる疑問の答えを探求できる授業にし、実践的な学びを提供しています。
図2 実データ(候補者アンケート)の分析事例
(3)受講状況の量的分析に基づく授業改善
全学必修科目の「データリテラシー」では、1学年約2,000人の受講状況や授業アンケート結果を量的に分析し、学生の理解度を学修項目ごとに把握して授業改善に活用しています。オンデマンド授業で使用した動画教材では、動画の視聴データを分単位で集計し、視聴者の離脱率が高まる時間帯の解説をより丁寧で分かりやすいものに再編集するなど、具体的な改善策を講じています[5]。
(4)生成AIを活用したプログラミングの実践
プログラミング演習を含む科目では、近年注目を集める生成AIの例として、GPT(Generative Pretrained Transformer)のしくみを解説しています。その上で、学生がGPTを活用したサービスのChatGPTを用いてプログラムのコードを作成し、思いどおりに動作するか確認する演習を行っています。相次いで公開される最先端の技術を学び、実際に利用することで、より高度な処理が可能になることを実感してもらう機会にしています。
(5)データサイエンスに精通したTAの確保
本学は文系学部のみで構成されるため、データサイエンスの学習支援を担うTAの確保が課題となっています。そこで、近隣の大学と連携して工学や情報学を専攻する大学院生を対象にTAを募集し、学生への学習支援の質を向上させています。また、本プログラムの開講期間中は、平日日中にTAが大学図書館に常駐し、学生からの質問に随時対応できる体制を整備しています。
(6)生成AIによるTAチャットボットの利用
全学必修科目の「データリテラシー」では、1学年約2,000人の学生が履修するため、効率的かつ効果的な学習支援体制の整備が求められています。これまでは、授業内容に関する学生からの質問を想定し、約250問のQ&A集を事前に作成して活用してきましたが、このQ&A集を基に、生成AIのGPTを微調整(Fine-tuning)して開発した専用の「LINE AIチャットボット」を導入し、24時間体制での自動質問対応を実現しました。これにより、学生はLINEを通じていつでも気軽にチャットボットに質問し、授業内容に関する疑問を解決できるようになっています。
さらに、OpenAI社が提供するGPTs[6](ユーザーが目的に応じてChatGPTをカスタマイズできる機能)を利用し、Q&A集を外部知識として活用するRAG(検索拡張生成)の機能を備えたカスタム版ChatGPTのTAチャットボットを開発しました[7][8]。このチャットボットは「データリテラシー」の授業内容に固有の質問にも対応可能で、例えば、課題の締め切りや確認テストの受験可能回数のほか、学内の設備環境など、具体的な質問に正確に回答することができます(図3)。2024年5月からChatGPTの無料ユーザーにもカスタム版ChatGPT が利用可能になったことで[9]、すべての学生がRAG機能を備えたTAチャットボットを活用できるようになり、より充実した学習支援が提供されています。
図3 TAチャットボットによる質問対応の例 図4 授業と自主学習に活用できる独自教材の例
(7)学習効果を高める教材の作成と提供
プログラミング演習を含む科目では、各回の授業内容に沿ってプログラムコードや実行結果の解説をまとめたノートブック形式の教材を独自に作成しています。この教材は、R学習用の.Rmdファイルと Python学習用の.ipynbファイルとして用意され、事前に学生に配布することで学習効果の向上を図っています(図4)。学生はこれらの教材を授業前後の自主学習に利用することで、スキルの定着を効率的に進めることができます。
また、応用基礎レベルの2科目はエキスパートレベルの専門教育への橋渡しの役割を果たすため、授業内では概念のみを解説する内容(例:主成分分析、Webスクレイピング、自然言語処理、重回帰分析など)についても、実データと分析手順を詳しく示した教材を別途提供しています。これにより、学生は高度な専門教育を受けるための準備として、自己研鑽を進める環境が整えられています。
(8)エキスパートレベルに向けた準備講座
応用基礎レベルからさらに進んでエキスパートレベルの教育を受けるための準備として、連携企業による特別講座を定期的に開講し、補完的な教育を実施しています。特別講座では、企業や実社会の課題解決の場面でAIやデータ分析がどのように活用されているか具体的事例を紹介し、学生が実務への理解を深める機会を提供しています。
(9)LMSと学修ポートフォリオによる学習管理
プログラムを構成する各科目では、LMS(Learning Management System)としてMoodleを活用し、出欠確認や成績評価など、授業運営に関わる一連のタスクを効率的に管理しています。授業で使用したすべての教材をMoodle上に公開し、学生が繰り返し学習できる環境を整えています。
また、学生が在学中に履修した全科目の成績やディプロマ・ポリシー(DP)の観点別評価に加え、学生が設定した学修目標やその振り返りを一元的に把握できる「学修ポートフォリオ」を導入しています。このポートフォリオにより、教員は各学生の学習状況をきめ細かく把握し、必要に応じて指導や助言を行うことが可能になっています。
(10)産業界と連携した課題解決型授業の実践
九州内の73企業・団体(2024年10月15日時点)で構成される「九州DX推進コンソーシアム」の地域デジタル人材育成活動に参画し、本学が強みとする商・経済・法の分野で実績があるデロイト トーマツ グループと2022年12月に「データサイエンス教育に関する連携協定」を締結しました。この協定の下、エキスパートレベルの科目「データサイエンス実践」において、連携企業から派遣された実務家講師が課題解決型の実践授業を行っています。
授業では、学生が3〜5人のチームに分かれ、グループワーク形式で学びを進めます。実在する海外の銀行の顧客動向データなど、現実に近いオープンデータを分析し、顧客の維持や新規開拓における課題を特定した上で、顧客の増加に繋がる改善策を検討します。最終講義では、各チームが「顧客や上司に提案する」という設定で改善策を発表し、提案先役の講師との議論を通じてフィードバックを得ます。現実のデータを扱うため、事前に立てた仮説と実際の結果が異なる場面もありますが、その差異が生じた原因を考察する過程を重視することで、データを起点とした課題解決能力に加え、実社会での応用力の育成にも取り組んでいます。
最先端のデータ解析の知見を取り入れた授業を通じてデータサイエンスの高度人材を育成し、地域に輩出することで、デジタルを活用した地域社会の課題解決に貢献しています。
(11)「デジタル人材育成のための教材」の活用
本プログラムで学ぶ内容が実社会でどのように役に立つのか、在学中に直接知る機会は限られています。そこで、数理・データサイエンス・AI教育強化拠点コンソーシアムの九州・沖縄ブロックと九州経済産業局が連携して製作した「デジタル人材育成のための教材」[10]を全学必修科目の授業に導入しています。この動画教材では地元九州・沖縄の企業10社が提供するITやAIの活用事例や、デジタル技術を活用したDXの事例の解説が各社30分程度でまとめられています。この教材を通じて、学生は地域の企業がデータサイエンスやAIをどのように実践しているか身近に感じ、具体的な活用手法についても学ぶことができます。
(12)作成した教材の部外提供
本プログラムの各科目の教材は、他の大学等でも利用できるように工夫して作成しました。「データリテラシー」で用いる動画教材は、授業内容を15分程度の小単元に分割し、全部で約60本の動画(1本当たり15〜25分、総再生時間1,100分超)として配信しています(図5)。これにより、学生は通学時間などの隙間時間を活用し、自分のペースで学習することができます。
図5 小単元別に学修項目をまとめた動画教材
また、応用基礎レベルの科目で使用しているプログラミング言語の学習用教材(R学習用の.RmdファイルとPython学習用の.ipynbファイル)については、数理・データサイエンス・AI教育強化拠点コンソーシアムの九州・沖縄ブロック会議を通じて関係機関に紹介しました。これまでに複数の教育機関で教材の一部が活用され、数理・データサイエンス・AI教育の波及にも貢献しています。
本学の教育プログラムは、2024年8月に「MDASHリテラシーレベルプラス」に選定され、その成果を他大学や産業界を含む社会へ積極的に普及・展開していくことが期待されています。今後も、これまで取り組んできた上記の12項目をさらに推進し、教育内容の充実を図ります。
2025年度からは、領域横断的な課題解決を可能とするデータサイエンス技法の学修を深め、時代や社会の変化に即した資質・能力を伸長させることを目的とした「データサイエンス副専攻プログラム」[11]を開始します。
副専攻プログラムは、学びの基礎を固めデータサイエンスを理解する基礎段階(レベル1)から、学びを実社会で活かしキャリアにつなげる実践段階(レベル3)までの3段階で構成され、本プログラムの構成科目を核として体系的で充実した内容に再編されており、学生が段階的かつ計画的に学べるカリキュラムになっています。この副専攻プログラムでは、新たに「データサイエンス応用(データと社会)」が開講されます。この科目は全学部の教員が授業を担当し、学生は各教員の専門分野における最新のデータ活用事例を領域横断で学ぶことができます。同じく新規開講の「プログラミング基礎と活用」では、実践的なプログラミングスキルの習得を目指します。学生は実用的なサンプルプログラムを実際に動作させながら、データの変換、収集、自動化などの技法を学びます。さらに、前述の「データサイエンス実践」は副専攻プログラムの集大成として位置づけ、産学連携による課題解決型授業として内容を一層充実させます。
本学は、理工系の学部を持たない人文社会科学系の大学ですが、身の回りの様々な場面でデータが活用されている現状を重視し、今後も、デジタル社会においてデータの分析・解釈を通じて新たな価値を創造できる人材の育成に取り組んでいきます。
参考文献および関連URL | |
[1] | 統合イノベーション戦略推進会議, AI戦略 2019〜人・産業・地域・政府全てにAI〜, https://www8.cao.go.jp/cstp/ai/aistratagy2019.pdf(2024年12月3日参照). |
[2] | 新原俊樹, 甲斐尚人, データ分析の学習に活用するための実データの作成−参議院選挙2022候補者アンケート調査結果の事例−, 日本情報教育学会第6回研究会, 2023年8月2日 |
[3] | 日本放送協会,参院選2022 候補者アンケート, https://www.nhk.or.jp/senkyo/database/sangiin/survey/(2024年12月3日参照). |
[4] | 新原俊樹, 甲斐尚人, 国政選挙における各政党・候補者の政策的主張の違いと死票の分布の可視化, 日本ソーシャルデータサイエンス学会論文誌, 8(1), 10-21, 2024 |
[5] | 新原俊樹, 井手順子, 史一華, 2023年度「データリテラシー」科目の実施結果と課題の検証, 西南学院大学商学論集, 70(1-4), 77-95, 2024 |
[6] | OpenAI (2023), Introducing GPTs, https://openai.com/index/introducing-gpts/, (2024年12月3日参照). |
[7] | 新原俊樹, GPTsのRAGを活用したTAチャットボットの製作と評価, 日本情報教育学会第7回研究会 2024年8月2日 |
[8] | 新原俊樹, TAチャットボットへの検索拡張生成(RAG)の実装と回答精度の検証, 西南学院大学商学論集, 71(4), 2025 |
[9] | OpenAI (2024), Introducing GPT-4o and more tools to ChatGPT free users, https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/,(2024年12月3日参照). |
[10] | 経済産業省, metichannel, https://www.youtube.com/@metichannel/videos,(2024年12月3日参照). |
[11] | 西南学院大学, データサイエンス副専攻プログラム, https://www.seinan-gu.ac.jp/education_study/education_research/ds.html,(2024年12月3日参照). |