数理・データサイエンス・AI教育の紹介

筑波大学理工学群におけるデータサイエンス応用基礎教育

浦田 淳司(筑波大学 システム情報系准教授)

嚴  先(筑波大学 システム情報系准教授)

川島 宏一(筑波大学 システム情報系教授)

1.はじめに 〜本学のデータサイエンス教育と応用基礎プログラム〜

 本学では、1973年の開学以来今日に至るまで、基礎的な情報リテラシーとコンピュータの利用技術の修得を目的とした教養教育としての科目「情報」を全ての初年次学生の必修科目として開設してきました。現在は、データサイエンス・リテラシープログラム[1]として、「情報リテラシー(講義)」1単位と「データサイエンス」2単位を全学必修科目として提供し、実践力を重視したカリキュラムを展開しています。理工学群のデータサイエンス応用基礎プログラムは、リテラシーレベルの学生を理工学分野のエキスパート、さらにはトップ人材へと羽ばたかせる重要な“導管(conduit)”の役割を果たすためのプログラムとして構築しています。理工学群(数学類、物理学類、化学類、応用理工学類、工学システム学類、社会工学類の6つの学類で構成)の履修学生は、リテラシープログラムで身につけたスキルを基に、エキスパートに繋がる成長に向けて、応用基礎プログラムにおいて、各分野における数理・データサイエンス・AI(以下、MDA)の基本概念・手法とそれらを実社会の問題解決に適用する実践的スキルを修得します。
 本学のMDA教育は、図1に示すように、リテラシープログラムから、専門分野分析力と学際的実践力を有するデータサイエンス分野のエキスパート・トップ人材の輩出を目的としたデータサイエンス・エキスパート・プログラム(以下、DSEP)までのシームレスな教育体系を、学士課程初年次学生から博士後期課程学生までに対して、構築しています。DSEPでは、専門分野における分析力の涵養に加え、学際的な実践力を有する人材の輩出を目指した分野横断型の専門教育を志向しています。リテラシーから専門分野・エキスパートへの導管として機能するため、応用基礎プログラムは、各学類の実践的な科目を含む構成とし、専門分野と結びつけながら、MDAを実践的に学ぶプログラム構成としています。

図1 本学のMDA教育の体制と特徴

 具体には、理工学群の応用基礎プログラムは、線形代数やプログラミングなどで構成する基礎科目群と、AI・データサイエンス実践に関する専門教育科目群の二つの科目群で構成しています。基礎科目群の講義は、基本的に30〜45名程度のクラスで、講師とTAで講義・演習を行うことで、質問しやすい環境としています。また、プログラミング系の科目では反転授業の導入、数学系の科目は「つまづき相談寺子屋」の導入により、講義内外で多くの質問機会を学生に提供し、修得をサポートしています。専門教育科目群は、モデル・カリキュラムにおけるAI・データサイエンス実践を提供する科目で構成しています。それぞれの学類における専門分野の問題・現象を対象として実解析・実装を行う科目群としています。学類ごとの専門分野に通じる科目を指定することで、学生の専門分野を学びたいという動機とマッチする形で、応用基礎プログラムの修得を進めています。加えて、実践・Project-Based Learning(以下、PBL)系の科目は、最終成果発表会を伴うグループワークや、MDA実務専門家による特別講義・発表会講評を取り入れ、産業・地域と密接に連携を取りながら、実践力養成を図っています。こうした科目の具体例として、3.において、社会工学類の都市計画演習の内容を紹介します。
 また、本学のMDA教育の特色ある取り組みとして、筑波大学データサイエンス・ケースバンクの蓄積・展開があります。2.で詳述いたしますが、応用基礎プログラムやDSEPの成果を、追体験可能なケースとして蓄積し、インターネット上で誰でもアクセス可能な形で公開しています[2]。ケースの執筆も、学生自身が行っており、プレゼンテーション技術の修得も含めて、実践力の養成を図っています。

2.筑波大学データサイエンス・ケースバンク/データバンク

 本学は「開かれた大学」であることを建学の理念としています。本学のMDA教育は、建学の理念に則り、次の3つのオープン性を有する点を特徴としています:

① 専門分野の壁を取り払い、新たな知見を創造する学問分野間のオープン性

② 筑波研究学園都市の研究機関、自治体等との連携を深める組織内外のオープン性

③ 知的成果ケースやデータを他大学等と共有していくコンテンツのオープン性

 応用基礎プログラムでは、特に、Bのコンテンツのオープン化を、筑波大学データサイエンス・ケースバンクおよびデータバンクを通じて展開しています。図2に示すように、コンテンツのオープン化により、学生の分野横断的な学習支援と企業・自治体等との連携推進を目指しています。オープンなデータサイエンス・ケースバンクは、多様なトピックの社会問題・実課題の解決のために生み出された知的成果全体をわかりやすく編集したケースを、蓄積して公開する仕組みです。また、授業・研究等で用いた2次利用可能なデータをメタデータとともに整理したデータバンクも構築し、両者を連携して、公開・活用しています。

図2 データサイエンス・ケースバンク、データバンクの概要

 データサイエンス・ケースバンクは、“Find your way to a solution 答えの出し方はひとつではない”をコンセプトに、問題の本質を見つけ、実践で役立つ方法を見つけ出したケースと分析の追体験に資するデータを蓄積し、Web上で公開することによって、学生のみならず、企業、地域、ひいては社会全体にデータサイエンスの成果による裨益をもたらそうとする取組みです。公開している個々のケースドキュメントは、社会課題の解決策の提案のための最終的な分析方法のみならず、分析過程における試行錯誤も含めることで、利用者が研究・提案過程を追体験できるように作成しています。通常の論文や報告では、こうした過程を知ることはできません。それぞれの社会課題解決にむけて検討した過程を共有することで、ケースの追体験性を高めています。また、ケースが増えるほど、利用者が知りたいケースを見つけることが難しくなってしまいがちですが、参考にしたいケースを簡単に検索できるよう、目的・分野・手法の3つのカテゴリーごとに、検索タグを設定しています(検索タグの例は図2中央に記載)。また、各ケースは、冒頭にビジュアルアブストラクトを基本的に掲載しており、利用者は、ケースの概要をひと目で知ることができます。ビジュアルアブストラクトは、高校生や企業の方など、データサイエンスや掲載ケースの分野に詳しくない利用者の理解を助ける役目も果たしています。
 データバンク[3]においては、データの二次利用を前提として、「資源・資産のデザイン」「空間・環境のデザイン」「組織・行動のデザイン」および「データに基づいた地球環境規模問題解決」に関連する活動の分析に役立つデータを公開しています。公開されているデータごとに、メタデータ(データの概要に関する情報)とクリエイティブ・コモンズ(著作者が自らの著作物の再利用を許可する意思表示を手軽に行えるライセンスを策定・普及している国際非営利団体)による2次利用にあたっての条件も明示することで、利用者が活用しやすい形で共有しています。

3.学んだ知識の実践に向けたPBL科目

 本学理工学群におけるデータサイエンス応用基礎教育では、実践的なPBL系の科目を履修することで、学生に現実社会の現在の課題を認識させ、分野横断的な探求と専門分野での深化を通じて、実践的な能力を育成することを目指しています。この教育の具体的な例として、社会工学類の都市計画演習について、説明します。都市計画演習は主に2年生を対象とした3か月間週4コマの講義であり、つくば市を含む都市とその周辺地域の空間に関して、基礎資料の収集及び解析を通じて地域特性を理解し、さらにはその地域での都市・環境計画上の課題を自ら特定し、それらの問題解決方法を学ぶことを目的としています。
 この演習は、基本的にグループワークに基づいており、各グループの担当教員が予め定めたテーマに基づいて学生が希望するグループを選びます。2023年度の初回授業では、スマート空間計画、人間と環境、空間データサイエンス、社会的ジレンマ、サステイナビリティ、つくばの都市歴史、都市のモビリティという7つのテーマが担当教員によって提示されました。これらのテーマ名からも分かる通り、教員は具体的な課題を事前に設定するのではなく、方向性のみを示しています。学生は、テーマのみを参考にしながら、他講義で得たスキルやつくばでの生活経験を通じて感じた課題を当事者としての視点を活かしてグループワークに取り組みます。もちろん、課題の特定を行いながら、データサイエンスの知識・技術をどのように適用するかを学生自身が決定し、実践的なスキルも並行して習得していくことになります。
 具体的には、学生はグループ間のディスカッションやティーチングアシスタント(TA)、担当教員からのアドバイスを受けながら、取り組む課題を具体化していきます。2023年度は、学内循環バスの遅延、食堂の混雑、キャンパス内のループ道路の乱横断といった学生生活に密接に関連する課題があげられました。学生は選定した課題に関して、社会的な意義、解決すべき問題の詳細化、データ収集と分析の手法、期待される効果などを含む中間発表を行い、他の学生や担当教員からのフィードバックを受けとります。特に、必要なデータの種類やその収集方法が重要な議論のポイントになります。既存データの活用はもちろん行いますが、学生自身が直接に調査する場合や、企業や自治体にデータ提供を依頼する場合もあります。このプロセスを通じて、データを使用するだけでなく、その収集や管理の重要性についても学んでいきます。
 データ収集と分析の方向性が定まった段階で、学生は様々な調査や分析を実施し、エビデンスに基づく解決策を提案する準備を進めます。調査には、現場でのデータ収集だけでなく、関係者へのヒアリングやアンケート調査なども含まれ、実現可能な提案を目指します。2023年度には、学内関係者、地域の公共交通会社、カーシェアリング運営会社、つくば市など、多岐にわたる企業や自治体からの協力を得て、学生自身が、ヒアリングなどの独自調査を行いました。学生がそれまでに習得したデータサイエンススキルを応用するだけでは足りず、新しい分析スキルを学びながら行うことになります。例えば、Pythonを使った人流データの分析、地理情報システム(GIS)を利用したGPSデータの可視化(図3)、意識調査に基づく統計分析などが2023年度には行われました。データ分析に慣れていない学生をサポートするため、多様なデータ分析経験を持つ大学院生がTAとして参加しており、コミュニケーションをとりながら、学生のデータサイエンスのスキルアップを図り、実際の分析を進めていきます。

(a)GPSデータの可視化による代替路線検討
(b)バスの移動と遅延時間の可視化 (c)避難場所選定のための滞在人数の分析
図3 課題解決に向けたデータ分析の例

 最終的に、学生は問題発見から分析結果、エビデンスに基づいた提案を含んだ最終発表を行います。この発表では、成功した点だけでなく、失敗経験やそれをどのように克服したかについても共有し、失敗から学ぶ重要性を強調しています。さらに、調査や分析に協力いただいた企業や自治体の担当者を最終発表に招き、彼らからのフィードバックを受けています。また、フィードバックを受けるだけではなく、良い成果があれば、それが社会に還元される可能性もあります。例えば、2013年度に提案された「筑波大学へのバス深夜便の開設」は実現され、深夜時間帯の大学へのアクセス改善に寄与しました。また、この演習講義の成果も、前述の筑波大学データサイエンス・ケースバンクに掲載し、広く発信しています(図4)。

図4 データサイエンス・ケースバンクへの都市計画演習成果の掲載例

 都市計画演習の例からも分かるように、学んだデータサイエンスの知識を実際に応用する場としてのPBL科目は、データサイエンス教育の質を高める上で非常に重要です。学生は、現実課題の解決を具体に考えていく過程で、既存データの活用だけでは課題解決がなかなか難しいことを体感し、データサイエンスの難しさを感じながら、創意工夫していくことを経験することになります。この経験が、それぞれの学生の専門分野でのより実現性のある課題解決の基礎となると考えています。

4.おわりに

 本稿では、本学理工学群の応用基礎プログラムについて紹介させていただきました。大学・大学院全体の数理・データサイエンス・AI教育の中で、リテラシーレベルから専門分野へと繋ぐための導管として応用基礎プログラムを位置づけ、専門分野に繋がる実践的な講義・演習科目を重視しています。その一例として、取り上げた社会工学類の都市計画演習では、取り組むべき課題の特定、分析データの取得なども学生自身が取り組み、より実践的な設定の中で学んでいます。また、こうした演習成果や研究成果をオープンにし、多様なトピックの社会問題・実課題の解決のために生み出された知的成果全体を共有するためのデータサイエンス・ケースバンクも応用基礎教育の主要な取組みの一つになっており、継続して活動していく予定です。

参考文献及び関連URL
[1] 岡瑞起、佐久間淳、津川翔、福地一斗、平田祥人、「筑波大学におけるデータサイエンスリテラシー教育」、大学教育と情報、2022年度No.03、pp.25-29.
[2] 筑波大学データサイエンス・ケースバンク、
https://casebank.sk-tsukuba.university/(2024年3月12日閲覧)
[3] 筑波大学社会工学コモンズ データバンク、
https://commons.sk.tsukuba.ac.jp/data(2024年3月12日閲覧)

【目次へ戻る】 【バックナンバー 一覧へ戻る】