生物学の情報教育

生物工学分野の計算機利用教育


山登一郎(東京理科大学基礎工学部教授)



1.はじめに

 ある生物の生命情報として、必要な染色体の1セットをゲノムと呼ぶ。最近、各種生物のゲノムを明らかにしようとするプロジェクトが世界的に進展している。そのお陰で、生物の設計図である遺伝子情報が蓄積しつつある。現在、その情報をいかに解析して利用するかが問題となっている。基礎工学部生物工学科の実習では、特にコンピュータ通信網を利用して有用な科学情報を求める方法を体験しつつ、遺伝子情報解析の一端に触れる。
 また、ゲノム解析のおかげで、タンパク質の一次構造が明らかになりつつある。しかし、タンパク質は立体構造に折りたたまってその重要な機能を果たす。生命現象を普遍的な基本原理から理解するためにも、タンパク質一次構造から立体構造の予測法や立体構造解析およびその動態の解析が不可欠である。実習では、コンピュータを使用して、これらの研究アプローチを経験する。私達のこの実習は、計算機シミュレーションを取り入れている日本ではまだ数少ない実習であろう。
 本実習担当研究室のURLおよび担当者のメールアドレスを示し、随時質問できるようにしている。本実習のホームページはhttp://www.tb.noda.sut.ac.jp/~yamato/jisshu.htmにある。


2.実習項目

I.インターネットによるデータ検索、処理:データベース検索、核酸及びタンパク質一次構造情報の解析
II.計算機シミュレーション:立体構造表示ソフトRasmolの使い方、モンテカルロシミュレーション、分子動力学シミュレーション、計算結果の解析とパソコンによるデータ処理〔露出表面積、根平均二乗変位(RMSD)、二次構造、三次構造、回転半径の計算、ラマチャンドランプロット、位置エネルギーの計算など〕


3.具体的な内容

 実習Iでは、ある遺伝子のDNA塩基配列やタンパク質のアミノ酸配列を与え、その配列に関わる各種情報をインターネット上で得る。発現調節領域、GC含量、等電点、モチーフ、二次構造予測など、分子生物学・生化学の各種情報が得られることを体験する。例えば、DNA塩基配列からタンパク質をコードする部分(ORF)を推定し、そのアミノ酸配列を求め、そのタンパク質の二次構造予測などを行う。検索するべき項目は、http://www.tb.noda.sut.ac.jp/~yamato/jisshu/anal.htmにあり、そこから各検索・解析サイトにリンクしている。(これら各サイトは研究用のものがほとんどである。実習で大勢の学生が同時にアクセスすることによるネットの混雑と各サイトにおける負荷が問題である。そこで、実は教員があらかじめ各サイトで検索した結果を本実習ホームページ上に張り付け、学生にはこちらを参照するようにしてもらっている。)
 実習IIのモンテカルロシミュレーションでは、ポリペプチドのコイル構造の座標を与え、初期構造とシミュレーション条件の設定を各自行い、シミュレーションする。計算結果をRasmolで可視化して確かめる。次に、分子動力学シミュレーションでは、あるタンパク質の三次元構造の座標を与え、シミュレーション条件を各自設定して、分子動力学シミュレーションを行う。結果を可視化して確かめ、さらにこれらシミュレーションにより得られた結果をもとに、上記「2.実習項目のII」にあげた項目について解析を行う。解析結果を、プレゼンテーション用にパソコンを用いてグラフ化する。このような解析により、各種相互作用がタンパク質折り畳み構造形成に寄与する仕方やタンパク質の動態を実感してもらう。同時に、パソコンによるデータ処理法も実習することになる。


4.計算機

 本学野田地区にあるワークステーション教室において、各自1台ずつのワークステーションを使用する。学生には、本学入学時に各自アカウントが発行されている。1年次の実習で、ワークステーションの使用法の手ほどきも受けている。


5.教材

 実習Iでは、あるDNA塩基配列(GenBank Accession No.X05653)やアミノ酸配列(SwissProt Accession No.P00824)を与え、ホームページからの検索を行う。リンクしている各ホームページは、例えばURL:http://darwin.bio.geneseo.edu/~yin/WebGene/Protein.htmlのような形で与える。詳しくは、本実習ホームページhttp://www.tb.noda.sut.ac.jp/~yamato/jisshu/anal.htmを参照いただきたい。
 実習IIでは、ポリアラニンやポリグリシンのコイル構造の座標を与え、モンテカルロシミュレーションを行う。シミュレーションソフトは本研究室自作のものであり、未発表である。結果の表示ソフトRasmolはフリーソフトであり、http://www.umass.edu/microbio/rasmol/から得ている。一方、分子動力学シミュレーションは、細菌糖輸送に関わるリン酸基転移タンパク質HPrの座標(Protein Data Bank ID 1PTF)をもとに行う。ソフトは通産省工業技術院電子総合技術研究所の古明地博士作製のPEACH(http://www.etl.go.jp/~komeiji/md/md.html)を使用している。この分子動力学シミュレーション実習の内容は、本研究室から発表した研究結果(http://moldesign.chem.eng.himeji-tech.ac.jp/jcs/v4n4/a1/abstj.html)に従っている。また、これらシミュレーション結果の各種解析ソフトは、本研究室でこれまでに自作してきたものを使用している。


6.経費

 ワークステーションは本学で計算機教育用に準備したものを使用している。各学生は一定容量のディスクスペースを割り当てられており、それを利用している。もちろん各ワークステーションはネットワークに接続されている。


7.ティーチングアシスタント

 本実習において、スタッフ以外3名の大学院生にティーチングアシスタントをお願いしている。


8.問題点と今後の課題

 まず、CPUの時間不足があげられる。特に分子動力学シミュレーションは長時間を要するジョブであり、学生実習環境では満足に行えるものではない。途中を省略して、結果を与えている状態である。今後、ワークステーションの更新により計算速度の向上が見込まれ、また情報部門のワークステーション管理者との連携で、週末を利用するなどして長時間の利用も可能になりうると予想している。次に、NFSによるディスク管理環境で、ftp等によるデータの読み書きが混雑することがある。グループごとに順番にアクセスするなどの工夫をして混雑を回避している。NFSの改良とサーバの高速化により今後改善されていくと期待している。さらに、インターネットの各サイトでの混雑と負荷の問題については、「3.具体的な内容」のところで触れた。実習で研究用サイトを利用してよいかどうかの重要な問題に関わっている。私達は、教員があらかじめ得た結果を実習のホームページに張り付け、実際のWWWサーバにアクセスしないように工夫している。今後、日本の各教育機関での生命科学分野計算機利用教育用に、このようなデータベースサーバサイトの拡充を文部省または公的機関にお願いしたい。最後に、統計力学を習わない生物工学科の学生にシミュレーションの意味が理解できるか、という重大な問題がある。生体高分子の研究における計算機シミュレーションによるアプローチについて講義し、理解を深めてもらう努力をしている。


【目次へ戻る】 【バックナンバー 一覧へ戻る】