政府関係機関事業紹介
国立情報学研究所 オープンサイエンス基盤研究センター
前号では、オープンサイエンスと研究データ管理の政策的な情勢や、国立情報学研究所(NII)が提供する統合的な研究データ基盤NII Research Data Cloud(NII RDC)の概要について紹介しました。NII RDCは、管理・検索・公開の3つの基盤で構成されますが、今号では特に研究データ管理(RDM:research data management)のための基盤を紹介します。大学における研究データ管理の目的には、大きく分けて「研究公正」と「研究推進」の2つの観点があります。「研究公正」のためには、研究者が研究成果の証拠となるデータを適切に保存したり、研究不正の疑いが生じた場合にも組織として対応できる環境が必要になります。「研究推進」のためには、多様なデジタルデータを研究室や共同研究者間で管理したり共有する環境が不可欠です。今後さらにニーズが高まってくるこうした研究データ管理の機能を、最新の技術のもとで提供するのが、NII RDCの研究データ管理基盤 GakuNin RDM(https://rdm.nii.ac.jp/)です。
企業での研究データ管理と比較して、大学における研究データ管理は不十分と言えます。例えば、学生の卒業・修了や教員の異動・退職に伴いデータの所在やパスワードが分からずアクセスできなくなるケースがあります。研究室でサーバやクラウドストレージを独自に準備して、研究室や共同研究でデータ共有されているケースもありますが、その安定的な運用は容易ではありません。運用費やシステム管理者の雇用を競争的資金に依存している場合には、長期的なデータ管理インフラの実現が常に悩みの種となります。システムの運用を担当する若手研究者は、サーバ調達や管理のために、多くの研究時間を犠牲にする必要があります。単にファイルを共有するストレージを用意するだけではなく、研究公正に対応するために研究データを研究終了後10年間保存できる環境である必要があります。学外の共同研究者とファイルを共有する機会が増えていますが、セキュリティ要件を満足する環境の構築には、高度な知識が必要です。今後は、競争的研究資金を受ける際には、研究データ管理計画(Data Management Plan:DMP)と呼ばれるものを提出することが求められるようになります。セキュリティや研究倫理的な観点も含めて、適切な研究データ管理のための環境をもつことが、研究遂行上の必須条件になります。こうした内外からの複雑な要件を満足するシステム環境を、個々の研究者や研究室で対処するには限界があります。研究者が研究そのものに専念し、その効率を高めていくため、研究データ管理のための環境は学術機関に標準的に、整備していくのが妥当であると考えられます。標準的に研究データ基盤を整備することで、データ互換性が高まり情報共有が容易になり、研究支援者もデータ整備に関わりやすくなり、大学の研究力や認知度の向上と社会との連携が強化されます。
GakuNin RDMは、どの大学組織や研究分野でも共通で利用できる研究データ管理のためのプラットフォームとして開発を進めています。全国の大学に向けWebサービスとして提供し、大学による組織的な研究データ管理を国内で定着させることを目指しています。GakuNin RDMでは、研究者がDMPに基づき、パソコンやスマートフォンから研究データをアップロードしてWeb上で管理することができます。学内で提供されているストレージサービス、いわゆる機関ストレージと連携させて、研究者が共同研究者とデータを共同管理できます。研究証跡の情報を管理するために、研究者がシステムにアップロードした研究データを編集すると、変更されたファイルは変更した時刻を証明する情報と合わせて保存されます。今後の開発予定として、パソコンのディレクトリとストレージを同期するデスクトップクライアント機能、データ公開基盤WEKO3と連携して研究者自身がデータを公開するための機能、データ分析を行うためのデータ解析基盤(例としてJupyterHub)との連携機能など、研究者の研究活動を支援するツールを充実させていく予定です。
図1 GakuNin RDMと連携するストレージの概念
これらの機能により、GakuNin RDMは研究データ管理の目的である「研究公正」と「研究推進」を両立して実現できるサービスとなっています。GakuNin RDMの正式リリースは2020年度後半を予定しています。大学での導入にむけて、大きく二つの技術的な留意点があります。一つ目は、GakuNin RDMを利用するためには、学術認証(学認)フェデレーションに対応した大学の認証基盤が必要なことです。学認は大学の認証基盤を利用して、学内外のWebサービスにシングルサインオンするための仕組みです。GakuNin RDMは学認でログインできる研究データ管理サービスということです。貴学が未参加の場合は、学内のITを統括されている情報基盤センターや情報システム部門を窓口として、NII認証担当へお申込みいただく必要があります。詳しくは学認のホームページをご覧下さい(https://www.gakunin.jp/join/)。二つ目は、GakuNin RDMでは大学が構成員に提供するストレージを接続して利用することができます。GakuNin RDMの機関管理者向けの機能を利用して、機関ストレージを接続したり、機関の構成員が利用できる容量などを設定・管理することができます。GakuNin RDMに対応する規格やストレージの技術情報はNIIオープンサイエンス基盤研究センターまでお問い合わせください。
2019年9月現在、2020年9月末までの長期的な実証実験を行っており、参加大学の利用者から研究データ管理のための機能やシステム性能を評価していただいています。2019年9月現在、GakuNin RDMのオープン参加の実証実験には8機関(東京大学、京都大学、北海道大学、名古屋大学、九州大学、金沢大学、富山大学、広島大学)が参加しています。それぞれの大学で想定されている具体的な利用事例としては、参加機関をまたぐ大型の科研費プロジェクトでの利用検証、生命科学分野における研究不正防止のための画像検査システムとの接続実験、大学経営統合に向けた学内データプラットフォームの統一化、学内での研究データ管理の普及啓蒙のためのセミナーでの利用などがあります。このように、GakuNin RDMのサービスの応用範囲は広く、大学毎の実情に合わせた柔軟なサービス設計が可能です。実験では本格運用に向け、利用機関からのフィードバックを受けて、システムの改善や新しい機能開発を実施し、皆さまと共によりよいサービスを作り上げていく体制も同時に整えているところです。また、組織として研究データ管理に対応していくためには、学内でのガイドラインの整備なども必要になってきます。研究データ管理のための活用能力の向上のためには、図書館などの他部署と連携したワークショップやセミナーの開催も必要になります。NIIでは、GakuNin RDMのサービス提供に留まらず、大学ICT推進協議会(AXIES)の研究データマネージメント部会(SIG-RDM)などとも協力しながら、より包括的に大学における研究データ管理の推進を支援できるような活動へと展開していく所存です。
執筆時点で実施している実証実験は、2020年9月末に一旦終了します。2020年度後半の本格運用に向け、研究者が日常的にGakuNin RDMを利用できるように研究の慣習に合わせたソフトウェア改良を行い、より快適でセキュアに研究データ管理が実施できるよう計算機資源や情報セキュリティ対策の強化を行っていく予定です。GakuNin RDM実証実験には広く全国の学術機関からご参加いただけます。まずは、貴学の情報システム部門または情報基盤センターの窓口担当者様から、国立情報学研究所オープンサイエンス基盤研究センター(rcos−office@nii.ac.jp)までお問い合わせ下さい。(アドレスは全角文字で表示しています)