数理・データサイエンス・AI教育の紹介

東北大学のAIMDリテラシー教育

早川 美徳(東北大学 データ駆動科学・AI教育研究センター長)

中尾 光之(東北大学 副理事(AI・データ戦略担当)未踏スケールデータアナリティクスセンター長)

1.はじめに

 まず、タイトルのAIMDの説明から本稿を始めたいと思います。数理・データサイエンス・AIについての素養を持ち、それらを「正しく」理解・活用するとともに、社会課題の解決やイノベーションを創出できる人材の育成が、かつて無かったほどのスケール感を以て求められています。著者らも、大学教育やコンソーシアム活動に関わる中で、これら三つの分野を連ねた名称が何とも長く、使い勝手が悪く感じたこともあって、AIMD(AI, Math, & Data science)という短縮形を用いることにしました。
 本稿では、ここ数年間、本学が取り組んできたAIMD人材育成のうち、特に、リベラルアーツ教育を中心に、実現に至った経緯なども交え、紹介いたします[1]

2.新しいAIMD教育とその体制

 本学では、2018年11月に「東北大学ビジョン2030」を公表しました。その中では、「社会の転換期を生きる学生の創造力を伸ばす教育の展開」を重点戦略のひとつに挙げ、そのための施策として、未来社会に立ち向かうための基盤となる学士課程教育を実現すべく、AIMD教育をはじめ、グローバルリーダー育成、アントレプレナーシップ養成等の現代的なリベラルアーツを、学部・学科の枠組みを超えて学修できるようなカリキュラムの実現を目標に設定しました。それを踏まえ、①2020年度より、全ての新入生に対してAIMDリテラシー教育を実施すること、②意欲ある学生に応える「挑創(ちょうそう)カレッジ」を2019年度より開始すること、の2つの方針が大学の内外に示されました。
 まず①では、デジタル社会において必須のリテラシーであり社会的な必要性も高いAIMDリテラシー教育を、文理を問わず全ての新入学生に対して行うことを宣言し、AIや機械学習の基本を理解し簡単なプログラムが書けるようにするとともに、ビッグデータによる社会課題解決の例をAIの倫理や特質等も含めて学び、各自の専門分野で応用できるような基礎力を養うことを目標としています。政府の「AI戦略」が掲げるリテラシーレベル「50万人/年」の育成目標を意識しつつ、大学の初年次教育で実施することが当初より想定されました。
 次いで②は、より意欲的な学生が現代的リベラルアーツを実践的にかつ深く学べる機会を提供するもので、AIMDリテラシー、グローバルマインドセット、アントレプレナーシップの3つのテーマに対応し、東北大学コンピュテーショナル・データサイエンス・プログラム(CDSプログラム)、東北大学グローバルリーダー育成プログラム(TGLプログラム)、東北大学企業家リーダー育成プログラム(TELプログラム)の3つのプログラムを新設し、学士課程の学生のうちの希望者が1つまたは複数のプログラムを受講し、修了者は修了証を発行して認定しています。挑創カレッジCDSプログラムは「AI戦略」の応用基礎レベル「25万人/年」の育成目標を意識しつつ、知識・技能・マインドにおいて、エキスパート人材育成への橋渡しとすることが企図されました。
 なお、この挑創カレッジの構成は、本学が考える人材像に照らしてその後も検討が加えられ、2022年度からは、上記に加えて、東北大学SDGsプログラム(SDGsプログラム)と東北大学プルリリンガル・スタディーズ・プログラム(TU PlusSプログラム)の募集も開始されています。
 こうした取組みを推進するための制度設計やカリキュラムの策定を所掌する会議体として、教育・学生支援担当理事が委員長となり、各部局の教務担当教員らによって構成される学務審議会が置かれています。同審議会の下には、全学教育の各科目の運営を担う科目委員会および個別事項ごとにいくつかの委員会が設けられており、AIMD教育に関係するものとして、データリテラシ共通教育基盤運営委員会、挑創カレッジ運営委員会、情報教育委員会、数学委員会があります。
 データリテラシ共通教育基盤委員会は、本学が2019年度より数理・データサイエンス・AI教育強化拠点コンソーシアムの協力校に採択されたことに伴い、必要な対応を行うべく設けられ、AIMD教育全体のカリキュラム体系の構築と教育体制の検討を目的として活動しています。そのため、情報系の部局のみならず、人文系、医学系等、多くの部局からの委員によって構成されています。
 挑創カレッジ運営委員会は、前述の挑創カレッジの運営全般を所掌する組織で、AIMD教育の全学プログラムであるCDSプログラムを含む、各プログラムの内容や修了要件の検討、プログラムを横断した新しい取組みの企画等を行っています。
 学部1・2年生を主な対象とする全学教育の中で、情報関係の科目の運営を担当しているのが情報教育委員会(2021年度までは情報基礎委員会)で、情報科学研究科、工学研究科、データ駆動科学・AI教育研究センターの3つの部局が企画担当部局として中心になり、情報関係の全学教育科目の運営にあたっています。2022年度から始まった新カリキュラムの下での全学教育では、情報関係の科目は、先進科目類・現代素養科目群として整理され、単に情報リテラシーのみならず、後でさらに詳しく紹介するように、AIMDに関係する複数の授業が実施されています。
 AIMDリテラシー教育の中でも特に数学と統計関係の科目を所掌する科目委員会が数学委員会で、企画担当部局として、情報科学研究科と理学研究科が中心となって運営されています。数学関係の科目は、全学教育の中で、基盤科目類・自然科学群として位置づけられています。
 さらに、AIMD関連のカリキュラムや科目の詳細な設計、教材開発と提供、教育環境の整備等を担当する組織として、教育情報基盤センターの改組により、データ駆動科学・AI教育研究センターを設置し(2019年10月)、専任の教員および技術スタッフを配置し、データ科学教育研究部門、AI教育研究部門、デジタル教育研究部門、データ基盤・セキュリティ教育研究部門、そして基盤技術部門の5部門体制で活動を開始しました(2022年度の当初時点で、専任教員13名)。

3.AIMDリテラシーレベル ―新入生全員が履修―

 2020年度から新入生全員(約2,400名)にAIMDリテラシー教育を実施するために、中心的な役割を果たした科目が「情報基礎A」および「情報基礎B」(各2単位)でした。これら2つの科目は基本的には同じ理念と目標の下に実施されていましたが、扱う内容やトピックについてAは人文系や医学系、Bは理工系向けに調整されており、2005年度までは全学部必修であったところが、その後の学部・学科の事情(専門科目のコマ数の確保)によって、必修または選択必修、選択科目、あるいは展開科目といった具合に、対応が別れることとなり、2019年度まで「情報基礎A/B」の履修率は新入生全体の8割ほどの状況で推移していました。
 そこで、この「情報基礎A/B」の内容を精査し、モデルカリキュラム(リテラシーレベル)の要件を満たすように変更・追加を行ったうえで、「AIMDの基礎」科目として2020年度から新入生全員に履修させることを、データリテラシ共通教育基盤委員会で決定しました。
 それを受けて、学務審議会を通じて各部局への働きかけが行われた結果、2020年度の「情報基礎A/B」の履修率は99%以上となり、事実上、全員履修を達成することができました。さらに2022年度からの新カリキュラムにおいて、「情報基礎A/B」は「情報とデータの基礎」に科目名を変更の上統合され、全学部で必修化されることとなりました。
 もともと「情報基礎」は、第1セメスターに開講され、1年生に基本的なソーシャルスキル(情報倫理やサイバーセキュリティ)とアカデミックスキル(情報システム、プレゼンや文書作成、計算機科学的発想による問題解決)を涵養することも目的に設定されていた科目で、データ科学に関係する内容は含むものの、必ずしも、モデルカリキュラム(リテラシーレベル)に掲げられる内容全てを包含するものではありませんでした。
 2019年度の時点で「情報基礎」が特に重視していた事項に、サイバーセキュリティ教育と、コンピュテーショナル・シンキング(計算機科学的な問題解決)の涵養のふたつがあげられます。
 前者は、本学の第3期中期計画の中でも言及があり、かつ、サイバー空間での様々な脅威が増大する中で、入学から間を置かずサイバーセキュリティについての基本的な知識と態度を涵養する目的で科目に取り入れたものです。
 「情報基礎」は100名を超える規模で23クラスが開講されており、各学部から推薦された教員が担当しています。一方で、人文系などの学部については、情報科学研究科等の教員が担当することで、全学部への開講を実現しています。担当者は必ずしも情報科学やデータ科学の全般に精通しているとは限らないため、特に変化の著しいサイバーセキュリティについて、最近の動向や事例の紹介を全ての教員に求めるのは難しく、また、他のトピックに割くための時間を確保するためにも、共通的なオンライン教材を用意することにしました。
 実際には、大手グローバルIT企業のサイバーセキュリティの前線で活躍している実務家(本学特任教授)の協力の下、ビデオクリップ「サイバーセキュリティ基本教材」を制作し、情報処理推進機構(IPA)が公開している教材等と組み合わせて、授業時間外に学習の上、授業での討論(反転学習)やレポート課題の形で定着化させる手法を採用しました。このサイバーセキュリティ教材は、毎年内容を改定しつつ、現在も使われています。そして、これと同様のアプローチを、数理データサイエンスのモデルカリキュラムに盛り込まれている他のトピックについても応用することにしました。それが、後述するeラーニングAIMD for Future です。
 計算機科学的な発想と思考による課題解決が今日的な重要な素養であることは論を待たないと思います。「情報基礎」ではアカデミックスキルの柱としてコンピュテーショナル・シンキングを掲げ、教科書の刊行や教材開発を進め、プログラミングを含む演習も実施していました。

4.既存科目の再設計

 この「情報基礎」をAIMDの基礎として再設計する中で、デジタル・ネイティブである新入学者に対して、パソコンの使い方についての比重を減らすことで授業時間を確保しつつ、かつ、アカデミックスキルの新たな柱としてデータ・リテラシーを追加する方針を情報基礎委員会で決定しました。それに伴って、これまで演習にCやJava等のプログラム言語を使用してきたところを、Pythonを主に用いることとし、コンピュテーショナル・シンキングに係るテーマの中でPythonプログラミングの導入を行いつつ、データ・リテラシーとして、具体的なデータ処理を体験させることにしました。使用プログラミング言語の変更については、担当教員から異論も出されましたが、特にAIMDの導入として使用することを考えますと、適切な選択であったと考えています。
 リテラシーレベルのモデルカリキュラムは「導入」「基礎」「心得」をコア学修項目として定義していますが、そのうち、導入部の「社会におけるデータ・AI利活用」について、現場を踏まえた事例紹介や最新の動向等は、企業などの実務家のほうがよりリアリティをもって説明することができるでしょう。
 また、データの扱いの基礎を学ぶ際に前提となる基本的な統計等の知識については、全学生を対象とすることを考えると、高等学校の数学の内容の復習を含め、基本事項の復習と確認を自学習できる環境が必要と考えられました。
 そこで、地元の仙台市を拠点に全国的にAI人材育成を手掛けている企業に話しを持ちかけ、リテラシーレベルのeラーニングを共同研究し、その成果を授業で使用することにしました。その教材はAIMD for Futureと命名しました。
 AIMD for Futureは、トピック毎のビデオクリップから構成され、全体で140分ほどの分量で、進捗状況が自己確認できるようになっています。

表1 全学教育のAIMD科目群
(†AIMDの基礎必修、‡CDS必修)
表2 AIMD for Futureで扱われているトピック一覧

5.AIMD応用基礎レベル ―全ての学生が学べる体制―

 より意欲的な学生に向けた挑創カレッジCDSプログラムは、応用基礎レベルのモデルカリキュラムを包含する科目群(情報の基礎、統計の基礎、数学の基礎)で構成されており、「実践的機械学習Ⅰ」および「機械学習アルゴリズム概論」(それぞれ2単位)を必修とし、その他、情報の基礎から4単位、統計の基礎、数学の基礎からそれぞれ2単位以上を取得することが修了の要件となっています。修了者には修了証を発行している他、2022年度からは、オープンバッジを発行する予定です。
 CDSプログラムにおいても全ての学生の履修が可能で、CDS科目を必修、または選択必修に指定している学部・学科もあります。このように、全員がAIMDの基礎のみならず、応用基礎までを学ぶことができる全学的に開かれた教育資源としてCDSプログラムは機能しており、事実、学部高年次生、および大学院生も少なからず履修しています。
 そのため、時間割の上でも工夫し、学部毎に指定された授業が開講されていない時間帯にCDS関連の授業を配置するようにしています。
 また、全員が履修できるだけでなく、研究型総合大学として特色のある科目の開発と提供も本学のAIMD教育が目指しているところです。その一つの試みとして開発した科目に「数理・AI・データ科学 −データ生成・活用の現場に立ち会う−」(2単位)があります。この科目は、データを駆使しながら最先端の研究を行っている研究室を取材し、研究現場の体験を踏まえてグループディスカッションを行うことでより身近なテーマとして考察を深めてもらうことをねらいとして開発しました。取材先として、文学、経済学、工学、情報科学、医学等の各大学院や附置研究所の研究者の協力を要請し、快く引き受けていただけました。企画の当初は、学生を連れて文字通り研究の現場を見学する機会も設ける計画もありましたが、コロナ禍が継続する中での実施は諦め、基本的にオンデマンドのコンテンツを整備することにしました。
 研究者には、研究の中から学部初年次の学生でも比較的理解が容易と思われるトピックを選んでもらい、それについての30分程度の講義ビデオの作成を依頼しました。折しものコロナ禍でオンデマンド教材の制作にはどの教員も習熟しつつあるところでした。次いで、学習イベントの企画・実施や教材制作に経験のある地元の企業に依頼して、オンデマンド教材の内容に沿って、研究を巡る様々な課題についてのインタビューを行いその様子を映像にまとめておきました。
 授業に先立って、まずオンデマンドビデオで研究内容についての事前学習を行い、授業ではインタビュー動画の視聴と担当教員からの補足説明の後、少人数のグループに分かれてのディスカッションを行うという、反転授業形式で進行します。これまでのところ、授業はウェブ会議システムを用いてオンラインで実施しました。
 2021年度までに取り上げられたトピックは、マテリアルズ・インフォマティクス(軟X線を用いた物性計測)、数理行動科学(人流データ等の分析とモデリング)、経済学的データ分析(大規模社会調査)、医療画像データ分析(脳MRI画像のAI分析)、大規模コーホート調査(ゲノム情報等の分析)、医療統計学(ヘルスケアデータの分析)、地理情報科学(リスク分析)、ロボティクス(アクティブ・データセンシング)で、今後、さらに対象分野を拡大する計画です。
 授業では、データ分析手法やAI等のテクノロジーについて知識を得るだけにとどまらず、社会でのビッグデータやAIの多義性や、ダイバーシティを許容する社会の実現等、多様な視点で議論が交わされています。
 CDSプログラムの必修科目である「実践的機械学習Ⅰ」の履修者は2020年度に139名、2021年度161名、そして2022年度には250名を超える初期登録がありました。同じくCDS必修に指定されている「機械学習アルゴリズム論」では、2020年度191名、2021年度242名と順調に増加しています。学部入学定員が約2,500名ですので、その約1割程度が自らの意思で応用基礎レベルの内容に取り組んでいることになります。
 ハンズオンを伴う科目である「実践的機械学習Ⅰ/Ⅱ」は、現在1名の教員が担当しており、履修者数の推移によっては今後クラスの増設が必要となる可能性もありますが、全ての教材と演習環境はオンラインからアクセスでき、授業もオンラインと対面をハイブリッドで実施しつつ、複数の教室を使った同時中継も併用してキャンパスでの受講人数も確保する等、大人数クラスであっても双方向的な授業が実現されています。

写真1 「実践的機械学習Ⅰ」の授業風景

6.地域との連携協力体制の構築

 全員が必修の「情報基礎」(今年度からは「情報とデータの基礎」)では、プログラミングを伴う演習など、学生によっては難しく感じるであろうトピックを扱うため、学生による授業評価アンケートでは、「授業が駆け足気味」であることを示唆する記入も散見されています。しかしながら、全学教育の他の科目と比べると、学生の評価は高く、アンケートでは、さらに先まで学んでみたいとの意見も少なからず見られるため、授業の実施方法等に改善すべき点は残るものの、AIMDの導入部として機能しているように感じています。
 さらに学年が進んでいく中で、専門教育で培われる知識や技能とAIMDの素養を結びつけながら、成熟した市民たることは無論として、社会課題解決やイノベーション創出を担う人材を育成することが、本学が目指しているところです。
 それには、単にカリキュラムを整備・充実するだけでなく、学生達が早い時期から様々な領域の「現場」で活躍する人々を接する機会を設けることも重要かつ効果的です。
 そこで、本学が包括連携協定を結んでいる企業の協力を得ての「リアルビジネスにおけるデータサイエンス/AIの活用」と題する連続セミナーや、特に文系の学部学生を想定した内容の「AI入門講座」シリーズ等、課外の学習イベントを開催してきました。これらのイベントの講師は企業の現場で活躍している方々で、学生の反応も良好です。
 また、データ科学やAIのオンライン教育プラットフォームの開発・提供で実績のある地元企業の協力を得て、一般社団法人日本ディープラーニング協会が実施している「G検定」および「E資格」の受験に向けた学修支援を2020年度から実施しています。具体的には、企業がこれら資格の取得に向けて一般に提供しているオンラインコース(本学の教員が監修)の受講を、挑創カレッジCDSプログラムの履修者の中で希望する者に対して支援する試みです。この取組みを通じて、これまでに合格した学生は、「G検定」が16名、「E資格」が7名と、多くはありませんが、参加者からは『このような自分からは受けないような講座を支援してもらい受けさせてもらうことができて本当に良かった。この体験をなにかに活かせるようにしたい。』等、肯定的な意見が寄せられています。その一方で、時間の確保が難しかったり、教材の内容についていけないなど理由で受験に挫折するケースもあり、より手厚いフォローアップが必要と考えています。
 機関を超えた取組みとしては、東北地域の国立大学(弘前、岩手、東北、宮城教育、秋田、山形、福島、新潟の各大学)が協同し、人材育成や研究等を通じて東北の課題解決と豊かな地域社会の実現を目指す「東北創成国立大学アライアンス」が2021年度に発足しました[2]。中でもAIMD人材育成の連携は、アライアンスの取組みのひとつの柱となっています。シンポジウムの開催をはじめ、ウェブ上での各大学の取組み状況や、科目や教材の共有等がすでに行われているところです。
 また、AIMD関連科目の多くは、「学都仙台単位互換ネットワーク」により仙台地区の他大学にも開放されている他、2022年度からは、宮城県との高大連携事業の一環として、科目の一部は高校生にも履修を許しています。

7.AIMD教育の評価体制と将来像

 以上駆け足でここ数年間の本学の取組みを紹介してきましたが、外部からの助言を得るため、2021年度からは、企業や自治体等の専門家に委員を委嘱し、AIMDアドバイザリ委員会を設置し、AIMD教育の改善に繋げる取組みを始めているところです。
 委員会の場では、企業においては独自に教材を開発するのではなく、専門家が市販の教材等を選定・コーディネートして、社内教育に活用している事例が紹介され、既存の教材もうまく組み合わせてはどうかという提案や、リテラシーやエキスパート等の階層を超えた教員の交流やコンテンツの共有・活用による現場の活性化、学習者の進路等も考慮した学習内容の最適化の検討、アカデミアとしてのAIMD教育の理念と目的等、様々な観点から議論が交わされ、次なる段階に向けて貴重な示唆を得ているところです。
 私見ではありますが、リベラルアーツ教育の重要な目標のひとつは広い意味での「言語」の修得にあるように思います。外国語の運用能力や論文やレポートの書き方は勿論として、それぞれの分野でのコトバと作法を身につけ、自由に操れるようになるための準備とでも言いましょうか。数学が多くの理系分野の共通言語であるように、これからは、AIMDも文理を超えた共通言語として浸透していくでしょう。それぞれの領域での専門性を磨きつつ、共通言語としてのAIMDを使いこなし分野横断的に活躍する人材を育成してゆきたいと強く思うところです。

図1 東北大学のAIMDリテラシー教育体制
関連URL
[1] 東北大学AIMDウェブサイト:https://aimd.cds.tohoku.ac.jp/
[2] 東北創成国立大学アライアンス:https://tohokusosei-ua.jp/

【目次へ戻る】 【バックナンバー 一覧へ戻る】