東アジアの過去・現在・未来へ KU-ORCASキックオフシンポジウム

デジタルアーカイブが開く 東アジア文化研究の新しい地平

2018年2月17日(土)・18日(日) 関西大学千里山キャンパス 以文館4階

登壇者

武田 英明

国立情報学研究所 情報学プリンシプル研究系教授。総合研究大学院大学複合科学研究科情報学専攻教授(兼任)。1991年東京大学工学系研究科修了。工学博士。ノルウェー工科大学、奈良先端科学技術大学院大学を経て、2006年より現職。2005年~2008年東京大学寄付部門教授、2006年~2010年国立情報学研究所 学術コンテンツサービス研究開発センター センター長。専門は人工知能、Web情報学、学術情報流通

オープンサイエンスとオープンデータ

――ちょっと先の研究のあり方を考える――

オープンサイエンスとは一体何か?

様々な場所で聞くようになった、オープンサイエンスという言葉。実は人によって細かな解釈が異なります。それは何故かと考えるに、由来が複雑なため全体像が見えにくくなっているのかも知れません。

私は、オープンサイエンスには主たる4つのルート「科学」「学術出版」「政府」「市民科学」があり、これらのデジタル化、インターネット化がわずかな時間差で複合的に行き着いた結果が、現在の姿だろうという結論に至っています。そしてこれらの由来に鑑みると、オープンサイエンスは「デジタルメディアを用いた科学のボーダレス化である」とまとめることができます。研究者たちや研究フィールドを取り巻く機関や出版社、さらに一般の人や政府などとの垣根がなくなったのです。これにより、多様な科学の担い手が生まれてきました。インターネット環境があれば大学へ行かなくても科学を勉強したり多様なコラボレーションを生み出したりできる。オープンサイエンスによって、科学分野が良い方向に導かれるだろうと期待が高まります。

この度発足されたこのKU-ORCASは、まさにオープンサイエンスを意識し、その道の真ん中を進もうとされている。私としてはとても興味深く拝見しています。

オープンデータにおける新たな標準化の波

次に、オープンサイエンスの重要な基盤の一つであり、私の研究対象でもあるデータの共有・オープン化の未来についてお話しします。研究データや研究成果のオープン化・共有により、多様な研究プロセスが可能となってきました。今後はあらゆるステップのデジタル化が進み、研究者の手を離れたデータは外の世界と繋がっていくことになります。全てがデータになるということは、データ量が膨大に増え、人間の目を通さなくなるため真偽の判定が難しくなる。そこで重要な役割を担うのが、データに付ける識別データ、IDです。

直近ではどのような形でデータを公開すべきかという「FAIR原則」が国際的にデファクトスタンダードとなりつつあります。標準的なIDやメタデータを付与することで、他のシステム下でもスムーズに交換・連携できるメリットは大きい。また、URLが変わっても持続的にアクセス可能な識別子「DOI name(Digital Object Identifier)」や、IDを活用して相互に繋がるデータベースをつくろうという「Linked Data」など、新たなアプローチが多くの研究者や研究機関に採用され始めました。

これらが標準化されれば研究プロセスはより充実し、各データが正しく、大いに活かされ、科学のますますの発展に繋がっていくことと思います。