文学の情報教育
情報処理システム開発の現場から文学語学専攻者に求められる能力
荻野 孝野(大東文化大学文学部非常勤講師)
1. はじめに
今日のワープロにみられるような日本語処理システムの分野では、文系出身者の開発に寄与するところは大きい。そういった現場の経験から、新しい研究及び開発の分野への可能性を示唆するとともに、情報処理という手段を通して、日本文学および国語という専門分野対象に対し、自ら分析する能力と姿勢を身につけさせるということで、本講座を担当している。こういった背景と、大東文化大学における授業展開について紹介する。
2. 日本語情報処理の歴史
筆者は約26年前から、情報処理分野の研究に携わり、計算機による言語処理がどのような経過をたどってきたか、開発を通じて経験してきた。これは、計算機メーカーおよびソフトウエア業界における日本語処理の歴史でもある。
1970年代初期は、ワープロも仮名漢字変換システムもなく、日本語文を計算機に入力するには、3,000字ほどからなる漢字鍵盤を磁気ペンで押しながら入力するか、4けたの英数字の漢字コードを入力する時代であった。昨今の格安なワープロやパソコン用の仮名漢字変換システムの普及は驚くほどである。
3. 文学語学出身者に求められる能力
これらの日本語処理の進展を支えてきたのが理系出身のソフトウエア開発者と、文系出身のデータ作成者である。日本語処理は、プログラムを作っただけでは動かない。それらのシステムに合わせて整理された言語データがあって初めて動く。
例えば、言語処理システムの一つ「仮名漢字変換」では、べた書きのひらがな列から単語を認識し、漢字表記に変えるための辞書が必要であり、単語の接続可能性をチェックするための接続表が必要になる。これが、機械翻訳システムの開発だと、「動詞句→名詞句 + 動詞句」などといった構文規則も必要になってくる。さらに、今日のワープロの宣伝文句になっている「人工知能を用いた仮名漢字変換システム」などになると、「キシャのキシャがキシャでキシャする」を、「貴社の記者が汽車で帰社する」と変換するための、単語の意味分類や、名詞と動詞の意味的な共起関係の記述などが必要になる。
こういった部分を担うのが、辞書の作成であり、文法規則の作成であり、意味の分類である。これらは、大学で、語彙論や形態論や意味論に関する専門分野の教育を受けたものが担当できる部分である。言語を整理する地道なつみあげと、システムに載せるための、ある種の思い切りのよさが必要な部分でもある。
昨今は、インターネットがらみで、情報検索が注目されている。ここでは、データベースの自動抄録の作成や、検索キーワードの意味分類および意味体系の作成といった、文学部出身の学生が身近に取り組める活動分野が広がっている。
4. 授業内容
以上のような背景を踏まえ、筆者の授業はまず、
- 言語処理とは何か。何をする部分なのか。
- どういった部分に自分たちの学んだものを活かすことができるのか。
- そのために、必要な部分は何か。
という観点で展開する。
具体的には、以下のような授業内容である。
- 情報処理における言語分析の位置付け
言葉の分析が、情報処理のどんな部分に役立っているか、実際のシステムとの関係で概観する。
- かな漢字変換システムの紹介
- 分かち書きの手法の説明
- 計算機用の辞書作り
- 辞書における品詞の立て方
- 品詞分類のための、接続表の作成
- 情報検索とシソーラス
- 動詞分析:共起パターンについての紹介
- 言語分析のためのKWIC(文脈つきキーワードインデックス)の紹介
- インターネットによるWWWの検索
以上の授業に関連して、以下のような課題に取り組む。
- 形態素分割
文をいろいろな単位に分割してみる。
- 品詞分類
単語の品詞分類をやってみる。
- 辞書の構造化
一般辞書から構造化したデータを作る。
- 単語の接続表の作成とその分析
単語間の接続可能かどうかの情報をクロステーブル上に作成し、接続の傾向を分析する。
- 単語の意味分類
情報検索に有効なシソーラスを作成する。
- 名詞と動詞の意味的共起関係の作成
以上の課題を通して、学生に以下のパソコン操作を習得させる。
- パソコンにおけるファイル管理の概念
ファイルの移動、保存
- Windows画面の操作
画面の移動、縮小、拡大、配置
- 日本語エディターの使用
一太郎による入力、削除、挿入、入れ換え、罫線、印刷用形式の作成および印刷
- 表計算ソフトの使用
エクセル使用によるデータ入力、挿入、削除、入れ換え、罫線、ソートなど
- Internet へのアクセス
5. 個別対応による授業 今年度は、6つの課題に取り組んだ。個人によって、進み具合はバラバラ、終ったら次に進むという具合で、個別対応にならざるをえない。大東文化大学での授業は、アシスタントの方の援助で、現在これが充分に可能である。教官一人で、40人近くの学生一人ずつに対応するのは至難の技である。しかし、これをしなければ、学生はなかなかパソコンに慣れない。全く、個別に起こってしまう状況が異なるからである。また、近代的な設備で、先生の画面を各自が自分のデスクの脇で参照しながら、操作することもできるが、どうもこれだけで理解できるわけでもない。やはり、文字通り、手を取って、マウスの操作を掴んでもらうことも必要だ。こういう取り組みを可能にしているのが、アシスタントの方の補助という大変ありがたい体制である。
6. 今後の課題 今年度は、主に「システムに組み込まれる言語知識」という観点での授業の展開であるが、今後は、文学作品の分析にも役立つようなKWICの作成や語彙の抽出などもとりあげ、徐々にパソコンの利用範囲を広げたいと思っている。
【目次へ戻る】
【バックナンバー 一覧へ戻る】