数理・データサイエンス・AI教育の紹介

和歌山大学の数理・データサイエンス・AI教育プログラム
〜実践的教育を軸とした文理隔たりのない体系的な取組み〜

吉野  孝(和歌山大学 データ・インテリジェンス教育研究部門部門長 システム工学部教授)

西村 竜一(和歌山大学 データ・インテリジェンス教育研究部門講師)

三浦 浩一(和歌山大学 データ・インテリジェンス教育研究部門講師)

1.はじめに

 本稿では、本学における数理・データサイエンス・AI教育の取組みを紹介いたします。数理・データサイエンス・AI教育プログラムの作成にこれから取り組む、あるいは、すでにあるプログラムの改善を考えている大学等担当者さまを読者として意識しています。皆さまの一助になれば幸いです。

2.本学の数理・データサイエンス・AI 教育

 図1に、全学向けに開講している本学の数理・データサイエンス・AI教育プログラムの全体構成を示します。本学では、数理・データサイエンス・AI教育プログラムを2019年度に立ち上げました。

図1 本学の教育プログラムの体系

 当初から計画した科目は、「データサイエンスへの誘いA/B」「データサイエンス入門A/B」「データサイエンス基礎」(2020年度〜)「データサイエンス応用」(2020年度〜)「データサイエンス実践」(2021年度〜)「実践的データマイニング1」「実践的データマイニング2」です。「人工知能の初歩」「人工知能概論」「数理・データサイエンス・AI活用PBL」は、後から追加しています。
 図2に、各科目の概要を示します。学部1年生前期「データサイエンスへの誘いA/B」は、講義とExcelによる演習を中心に構成しています。「データサイエンスへの誘いA/B」は、2022年度までは全学必履修科目です。2023年度からは全学必須科目になります。学部1年生後期「データサイエンス入門A/B」以降は選択科目です。「データサイエンス入門A/B」では、Rを使います。学部2年生「データサイエンス基礎」以降では、Pythonを使用プログラミング言語としています。

図2 数理・データサイエンス・AI教育プログラムの授業内容(概要)

 次に、筆者たちが展開する数理・データサイエンス・AI教育プログラムの特徴を整理して以下に示します。

【特徴1】体系化された新しい科目群の提供

 特徴1は、図1でも示したように、体系化された科目群の提供です。
 皆さまのご所属では、既存科目の組合わせによる教育プログラムの構成を検討されることが多いのではないでしょうか。本学では、今回、全学的な方針の下、すべての構成科目を新規に立ち上げることができました。教育に割ける資源が限られるなか、これは幸運なことでした。結果として、教育プログラム全体を筆者たち自身が設計し、新しい授業を創り、体系を整えることができたと考えています。

【特徴2】すべての学部生が受講できる全学授業

 特徴2は、学部生向けのすべての構成科目が、全学向けに開講されていることです。
 本学は、教育学部、経済学部、システム工学部、観光学部の4学部で構成されています(2023年4月からは、社会インフォマティクス学環を加えて、4学部1学環)。所属に関係なく、すべての学生を受け入れるために、教養教育と専門教育の接続を目的に本学が独自に設置した「連携展開科目」という全学向け科目の枠組みにプログラム構成科目を配置しています。
 なお、大学院生向け科目については、これまでに、システム工学研究科、経済学研究科、観光学研究科の大学院生が履修できるようになっています。

【特徴3】オンデマンド型オンライン授業の活用

 特徴3は、構成科目の多くは、動画を活用したオンデマンド型のオンライン授業であることです。
 全学(本学では、1学年がほぼ1,000人)を受け入れるためには、授業の履修人数上限を撤廃する必要がありました。そのため、グループワークを伴う一部の科目を除き、教室等の物理的な制約を受けることが少ないオンデマンド型オンライン授業に授業の形態を統一することにしました。
 後述するように、オンデマンド型授業であっても双方向性は確保しています。また、何度でも動画教材を視聴、繰り返し復習できることは、プログラミングの演習等では大きなメリットになっています。

【特徴4】実データを利用できる実践的授業

 最後の特徴がもっとも重要です。本学の教育プログラムでは、授業の中で実データを利用することにこだわっています。また、文理隔たりなく、学生が参加しやすくなるように、具体性を伴う内容の授業を展開するようにしています。
 たとえば、「データサイエンス応用」では、「青空文庫(著作権がきれた小説)」や「Wikipedia日本語版ダンプデータ」、「声優統計コーパス」等のオープンデータを活用しています。
 また、非公開データが対象となりますが、「データサイエンス実践」では、「株式会社オークワ(和歌山県を中心に近畿地方や東海地方で展開しているチェーンストア)」からご提供を受けたID-POSの加工データを扱ったデータマイニングを実践します。
 大学院の「実践的データマイニング1」は、オークワとの協働をさらに発展させた授業です。膨大な匿名加工済みID-POSデータを利用します。それだけではなく、オークワ担当者が授業に常駐し、スーパーマーケットの経営や現場の知識を聞くことができるようになっています。
 もう一つの大学院向け授業の「実践的データマイニング2」では、「株式会社紀陽銀行(和歌山県に本店を置く地方銀行)」からの協力を得ています。加工がされているとは言え、貴重で膨大な銀行データ(匿名加工済みATMデータ)を利用できる授業は、他にあまり類がないと思います。また、この授業でも企業の担当者が常駐し、学生からの質問や疑問に答え、銀行業に関わる具体的知識を教えています。
 これらの取組みを実現するために、本学では、データサイエンス分野における連携協定を以下のように企業、自治体、官公庁と締結しています。

 このうち、県内のIT企業「株式会社サイバーリンクス」からは、数十人規模の演習で、機械学習を同時実行可能な高性能コンピューティング環境のご提供をいただくとともに、大学院授業の受講生サポートに参加していただいています。
 2018年に和歌山市内に開設された「総務省統計局統計データ利活用センター」には、「データサイエンスへの誘いB」の中で「公的統計データの利活用」という題目の講義をセンター長にご担当いただいています。また、「和歌山県データ利活用推進センター」からは、学部1年生向けの「データサイエンス入門A/B」の教材提供のご協力をいただいています。

3.「リテラシーレベルプラス」の認定

 本学は、2021年度に文部科学省「数理・データサイエンス・AI教育プログラム(リテラシーレベル)」に認定されました。早期に申請ができたため、第1回の11件に選ばれています。
 また、2022年度には、「数理・データサイエンス・AI教育プログラム(リテラシーレベル)プラス」に認定されています。「リテラシーレベルプラス」の認定には、先導的で独自の工夫・特色のある教育プログラムが求められます。本学の教育プログラムは、『地元企業提供のデータを利用した演習など、学生意欲の向上・学習効果が認められる取組みを行うとともに、身近なLINEやYouTubeを活用し、補完的な教育だけでなく、接点の強化に繋がる取組みを実施している。(公表された選定結果から引用)』ことが特色として評価されています。
 なお、本学の教育プログラムの構成科目のうち、リテラシーレベルの科目は、「データサイエンスへの誘いA/B」です。それ以降の学部生向け科目は、応用基礎レベルに相当します。本学では、応用基礎レベルの申請を2023年度に予定しています。

4.「リテラシーレベルプラス」の特色

 ここからは、本学の特色として評価されている取組みを具体的に紹介いたします。

(1)企業・自治体・官公庁との連携

 リテラシーレベルの「データサイエンスへの誘いA/B」においても、オークワ提供のID-POSデータを抽象化し、比較的小規模になるように加工したデータを使用する演習を行っています。
 ここでID-POSデータについての説明をすることで、学生が本物のデータを見ることができる機会をつくっています。これにより、後続の応用基礎レベル科目の受講を促すことができると考えています。

(2)授業内容の工夫

 「データサイエンスへの誘いA/B」は、本学に入学した1年生全員が受講することになるため、学修意欲の向上を目指した内容の工夫をしています。

① 講義の中で頻繁にクイズを出題

 図3は、動画教材の一場面で、クイズを出題しているところです。飽きさせないようにするために、頻繁にクイズを出題し、疑問を持ったまま視聴を継続するような状況を作っています。解答を直接的に動画の中で明かすことはありません(これには解答を明確に教えるべきだという反対意見も多いです)。

図3 動画教材(クイズの出題)

 また、動画視聴後には、LMS(Learning Management System, 本学ではMoodleを使用)を使った小テストとして、動画と同じクイズを出題することで復習ができるようにしています。

② 講義と演習をセットで構成する授業

 オンデマンド型の講義のあとには、その内容に関連した演習を必ず用意しています。「データサイエンスへの誘いA/B」では、基本はExcelを使った演習を行っています。できる限り各学生で異なるデータを用いて演習に取り組むことになるように課題を設定しており、例えば、図4では、受講生が住む街の気温と、その街の月別の商品の販売個数との相関の分析を行っています。

図4 動画教材(Excelの演習)

(3)充実した授業サポートの提供

 大学に入学したばかりの1年生向けにオンデマンド型のオンライン授業を実施するにあたり、受講の妨げが生じないようにするための注意が必要になります。このため、筆者たちは、授業のサポート体制の確立に特に注意を払ってきました。「データサイエンスへの誘いA/B」では、従来から存在する電子メールやLMSのフォーラム(掲示板)のほか、次の窓口(相談等の手段)を提供しています。

① Teamsをつかったオンラインサポート室

 Microsoftのビデオ会議・チャットサービスであるTeamsを用いて、週1回90分間のオンラインサポート室を開設しています。図5は、オンラインサポート室の様子です。テキストチャット、音声通話、画面共有などを組合わせて、授業担当教員が受講生のサポートを行っています。他の授業が終わった18時以降に実施することで受講生ができる限り参加しやすい環境の提供を心がけています。

図5 Teamsを用いたオンラインサポート室

② LINEチャットボットSUSAN

 独自に開発したLINEのチャットボットシステムを使って質問や相談に常に対応できる体制をつくっています。これは2021年度「データサイエンス入門A/B」からはじめた試みです。現在では、「データサイエンスへの誘いA/B」でも利用しています。
 チャットボットシステムを独自に開発しており、名前はSUSANです。図6に、学生が質問する際に使用するインタフェースを示します。

図6 LINEによる質問(学生側UI)

 SUSANの機能は大きく二つです。一つは、質問できる機能です。この機能では、受講生が入力した質問に対して、過去に類似の質問があった場合には、その質問と解答を提示することができます。
 ここで、受講生が「求めた回答でない」を選ぶと、はじめて授業の担当教員に質問が届きます。
 学生からの質問には、回答に必要な情報が含まれていない場合があるため、教員とのチャット機能と画像の添付機能があります。図7のやりとりの例では、学生の質問が曖昧(情報が不十分)であるため、教員は、エラーが生じた画面のキャプチャー画像を送ることを求めています。学生が画像を返信して、教員は適切な回答をすることができました。

図7 SUSANを通じた問題解決
(教員側UI)

 SUSANにはもう一つ、他の学生による質問(これまでの質疑応答のリスト)を一覧できる機能があります。図8のように、受講生は、過去の質問を見て、類似の質問を発見することで、問題解決の参考にすることができます。

図8 他の人の質問を閲覧(学生側UI)

(4)授業紹介動画の公開

 本学は、いわゆる文系学生が3分の2を占めています。アンケートや受講状況を鑑みるに、本学の学生には、データサイエンスを学ぶことの重要性をさらに認識してもらう必要があると考えています。そのためには、授業外の取組みも重要です。
 そこで、筆者たちは、2022年2月、YouTubeで「和歌山大学のデータサイエンス教育(授業紹介)」の動画を公開しました(図9)。この授業紹介動画では、関連授業を受講した学生及びティーチングアシスタント(TA)の大学院生が登場します。この動画の出演に参加をよびかけたところ、すべての学部から学生の協力を得ることができました。また、予想していたよりも熱心に、データサイエンスを本学の講義で学ぶことの魅力を語ってくれています。

図9 授業紹介動画
https://www.youtube.com/watch?v=BldPUgiDPTM

(5)デジタルオープンバッジの導入

 もう一つ、授業外での工夫を紹介します。本学の数理・データサイエンス・AI教育プログラムでは、当初から、リテラシーレベルと応用基礎レベルをあわせて10単位を修得した学生には、なんらかの修了証明書を発行する計画がありました。
 そこで、筆者たちは、2022年度に、一般財団法人オープンバッジ・ネットワークに入会し、2022年8月から教育プログラムの単位修得者にオープンバッジの配布を始めました。紙の証明書を発行するという方法もありましたが、今は、スマートホンを使って取得、管理ができて、国際標準規格で知識・スキル・経験のデジタル証明として使用することができるオープンバッジに将来性を感じています。
 発行するオープンバッジには、「科目バッジ」と「単位積み上げ型バッジ」があります。図10に、オープンバッジの構成を示します。

図10 オープンバッジの構成(黄色の枠上に配置しているのが単位積み上げ型バッジ)

 科目バッジは、単位修得で獲得できます。そして、複数の科目バッジを組み合わせることで、単位積み上げ型バッジを獲得することができます。具体的には、所定の4単位を取得すると「ブロンズレベル」が与えられます。ブロンズレベルのあとに、「データサイエンス基礎」を修得すると、「シルバーレベル」、さらに、シルバーレベルのあとに、「データサイエンス応用」を修得すると「ゴールドレベル」を獲得することができます。ゴールドレベルを獲得したあとに、「データサイエンス実践」か「数理・データサイエンス・AI活用PBL」の単位を修得できると、「ダイヤモンドレベル」になります。
 筆者たちは、この仕組みで、単位修得状況を可視化し、魅力的なサーティフィケーションを実現することができると考えています。

5.おわりに

 本稿では、本学の数理・データサイエンス・AI教育の取組みを紹介いたしました。
 筆者たちは、積極的に様々な取組みをすすめていますが、道半ばで、試行錯誤をする毎日です。
 例えば、大学院向け授業の一つは、8月に夏季集中として開講していますが、最初の受講生は、わずか9名でした。学生の多くは、(よくわからない)面倒そうな授業を避けたように思います。翌年度からは、積極的に宣伝するようにし、定員一杯まで集めることができるようになりました。2月に実施していた授業は、学生の就職活動と重なるため、9月末(夏季インターンシップに参加する場合でも戻ってくるだろうタイミング)に時期を変更しました。
 LINEのチャットボットによる学生サポートでは、質問数が3倍(授業7回で120件)になりました。自動応答は、質問が蓄積されるまでは機能せず、教員負担の増加が課題になっています。
 2022年8月には、約6,000個のオープンバッジを配布しました。しかし、受領率は30%程度です。宣伝不足の可能性が高いため、授業内での宣伝を増やしましたが、効果はまだ不明です。オープンバッジの実効性を高めるには、工夫の追加が必要です。
 数理・データサイエンス・AI関連分野のより良い教育を提供したいと日々考えています。今後ともご助言等いただけましたら幸いです。


【目次へ戻る】 【バックナンバー 一覧へ戻る】