新しい統計教育への取り組み

21世紀への新しい統計教育(データの科学)の提案


新 村 秀 一(成蹊大学経済学部教授)



1.はじめに

 最近大学生の基礎学力(特に数学)の低下が問題になっている。高校で数学を捨てた学生に、統計やORといった理数科目を、どうやって教えるか、それが今後の課題である。従来の講義形式で考えている限り、その解決策はないように思う。
 一方、21世紀の情報化社会の到来を迎え、情報処理教育の必要性が叫ばれ、情報リテラシー科目が多くの大学で開設されている。
 筆者には、これらを組み合わせることで、新しい実用的なユーザー教育を21世紀に向けて再構築する妙案がある。


2.統計ソフトとの関わり

 筆者は、大学では数学を専攻したが、社会に出てから自分の基盤を統計に求めた。そして、10年ほど苦学して統計の知識を習得した。その経験から、書籍で統計を独学で極める困難さを実感した。
  1. 統計の概念は難しく、多くの手法を体系的に理解するのには時間と努力と良き指導者が必要である。
  2. 良き指導者に恵まれず、独学する場合は、書籍の行間が読めないことが多い。
  3. 統計は、現実のデータを分析する学問であるが、書籍の勉強だけでは、いつまでたってもそれが行えず、達成感に乏しい。
 このため、28歳のときSASにめぐり合い、自分の勉強を兼ねその普及に携わり、上記問題の解決策を考えてきた。そして、その成果を3のようにまとめた。
 3年半前に大学の教員になり、その成果を実行に移しつつあるが、多くの学生にとってSAS言語の習得は難しいようだ。一方では、ソフトの費用の問題がある。
 大学では、商用ソフトの予算を捻出しにくいので、教員が統計ソフトを自作した時代がある。しかし、個人で開発しても、ユーザーインターフェイスや、保守や普及に労力がかかり、最終的には商用ソフトに駆逐されてしまった。また、教育に使え、社会人になって使えることが望ましい。
 そこで、筆者が考えたのは、商用ソフトの中から高品質なものの機能限定版を無償提供してもらい、解説書と一緒に配布するというスタイルである。統計に関しては、SAS、SPSSより後発であるが、グラフ機能に優れたStatisticaに的を絞った。その機能限定版を無償提供してもらい、解説書(パソコン楽々統計学、講談社、1997年)にCD-ROMを添付し出版した。現在、成蹊大学では、SASとStatisticaが100台インストールされている。学生は、自宅でPCがあれば、添付のCD-ROMのStatisticaで独学できる。また数学に関しては、数値計算と配列や行列を処理できるプログラミング言語のSpeakeasy(パソコンらくらく数学、講談社、1999年)に的を絞った。これらによって、大学の厳しい予算制約を回避し、21世紀に向けた実用的な統計や数学教育が行えるものと考えている。


3.統計教育の再編

 まだ多くの大学では、理論中心の講義がなされているようだ。そして、「統計は難しいものだ」と考える多くの学生を社会に送り出している。統計学は、数学のようにそれ単独で完結する学問ではなく、いろいろな分野の研究対象から得られたデータを分析し、そこから得た情報で研究対象を理解する実践的な学問である。しかし、それをテキストと電卓という制約で行うことは難しい。
 多くの学生にとって、抽象的な理論から入るのではなく、実際のデータを自分で分析しレポート作成のできる能力を教育する「データの科学」を最初に教えれば、全体が把握でき、目的意識が芽生え効果的である。
 統計ソフトを用いることを前提にすれば、グラフでもって難しい理論を直感的に理解させられるので、統計学をコンパクトに再編し、代表的な統計手法を体系化し、妥協することなく教えることができる。
 筆者は統計ソフトを利用して、次のような授業を試みている。
 一つのデータでもって、
  1. ヒストグラムで正規分布か否かを判定した後、標準誤差を含む基礎統計量の見方を教える。
  2. 散布図で相関係数の正しい見方を教える。
  3. 箱ひげ図で難しいt検定や多重比較を理解させる。
  4. クロス集計で、質的変数を理解させる。
  5. 散布図から、単回帰分析を教える。
などである。

 そして、自分でデータを集めさせ、レポート作成を行わせ、発表させている。その際、他の学生の発表の評価を行わせ、それをMS-Excelに入れたものを筆者が集め、解析し、データ解析の事例として最後の授業で説明する。学生は自己の評価に関心があるため興味を持つし、データは自分で集めたので、理解を深めるのに効果的であるようだ。


4.実施報告

(1)SAS
 SASは、1年次から取れる情報科学基礎(Ms-Word、Excel、SASを各4週)と2年次から取れる統計とデータプロセスII(12週にわたり、一つのデータをSASで分析する手順を教え、その後で自分で集めたデータを分析しレポート。使用法の習得に時間がかかり、発表は行っていない。)で教えている。いずれも半期2単位である。文科系の学生にとって、SAS言語は難しいようだ。また自宅のパソコンにインストールできない点、大学にとっては費用が高額となるという問題点がある。
 これまで3年間実施した中の学生の優秀なレポートを日本計算機統計学会(http://www.jscs.or.jp/)の第1回オンラインシンポジューム(テーマ:統計教育はこれでいいのか)の私の基調講演で紹介しているので見てほしい。この学生は2年次の前期に情報科学基礎を受け、後期に統計とデータプロセスIIを受けているが、統計の講義は取っていない。仮に彼が伝統的な統計教育だけを受講していたとすれば、これだけ立派なレポートを作成するという成果は得られなかっただろう。

(2)Statistica
 基礎演習は、1年生を対象に行っている。2年間は、テキストの輪講を行ったが成功しなかった。昨年度から、3で述べたことを実施している。 前期は、パソコン教室(教師用1台、学生用70台、各PCにモニターが付属)でStatisticaの実習を行った。
 後期は、グループでデータを集め分析した結果を3回発表報告させて、ブラッシュアップした。さらに、個人毎にデータを集めレポートを提出させた。いずれも、かなり質の高い内容のレポートである。
 また、他の発表に対し、相互評価を行わせ、授業最終日に分析結果を小職が報告した。統計の事例としても効果的であった。
 多くの学生は、統計やパソコンに熟練していなかったので、大変であるといっていたが、2回目の発表を終わったあたりから、かなりのグループで積極性が見られた。この成果も、前述のホームページに添付してある。
 うれしいことに、その何人かは今年前期の統計学基礎を受講して、1名を除いて高得点を得た。試験問題は、2変数×4件のデータを与え、手計算で基礎統計量(平均、中央値、四分位範囲、標準偏差、標準誤差、歪度、尖度など)と相関係数を計算し、行列演算で回帰係数を求め分散分析表を作成するというかなり難しい内容である。


5.終わりに

 今後は、筆者の試みを学部全体に提案・討議し、根づかせていく必要があると考えている。


【目次へ戻る】 【バックナンバー 一覧へ戻る】