東アジアの過去・現在・未来へ KU-ORCASキックオフシンポジウム

デジタルアーカイブが開く 東アジア文化研究の新しい地平

2018年2月17日(土)・18日(日) 関西大学千里山キャンパス 以文館4階

登壇者

Hilde De Weerdt

ライデン大学 教授

MARKUS,VISUS&COMPARATIVUS:

Developing a Text Analysis Infrastructure for East Asian Languages

個人のデータベースとして使用できる「MARKUS」

マークアップ・プラットフォーム「MARKUS」の制作プロジェクトに取り組んでいます。MARKUSは使用者個人が自分のデータベースとして使用できるという特長を持ち、テキストに対しタグ付けを行うことでデータを可視化。複数データを同一項目に関連付けるマッピングを叶えます。つまり、大量の情報を包括的に捉えられるので、研究者はより有意義な情報の分析を実現できるのです。

私の研究対象である中国明・清朝時代の宮廷の古文書、書簡で具体的な例を示します。この文字情報をMARKUSを用いてデジタル化&タグ付けしたところ、含まれる情報が紐付けられ、情報がリンクして、王朝ファミリーの顔ぶれや経歴、いつどこに住んでいたのか、時代・社会的背景は、といった有益な情報を読み解くことができました。各書簡に登場する同一人物の記述を一連の流れとして追うことができ、書簡の相手や時期、どういう内容を何のためにやりとりしていたかなど詳細も把握できました。

また、特定の情報を元にヒートマップを作れば地域別の細かな情報を読み取れ、より深い社会的背景の理解に繋がります。書簡データのヒートマップを時代ごとに比較した際は、その時代に宮廷の位置が移動していたという変化も読み取れました。

オープン・プラットフォームとしてのさらなる発展に向けて

MARKUSを形づくる要素として重要視したのが「情報へのフォーカス性」「他データベースとリンク可能であること」「テキストの中で情報の繋がりを構築・キープできること」という3点でした。MARKUSは他のプラットフォームに関連づけて様々な作業ができますし、他のデータベースからMARKUSへの直接インポートも可能です。Excelやウェブへのエクスポートもできます。また、任意ファイルをバッジでマークアップして自分だけのリストを作っておけば、内容の更新には自動で対応します。繰り返し使用することで学習機能が働き、自分に最適な1点を選びやすくなるところにもご注目ください。独自のユーザーインターフェイスであるため、初めは戸惑うかも知れませんが、すぐに機能性の高さ・使いやすさを理解していただけると思います。

プラットフォームとしてMARKUSを整備できたということは、すなわち情報をデータベースから引き出し、関連情報を引き寄せて、生きた情報として活用するための環境が整ったということです。今後はマークアップの検索精度をどこまで上げられるかが大きな課題です。さらに、韓国語バージョンも制作中。中国と近しい歴史を持つ国ですから、MARKUSにより周辺諸国を含む研究がさらに進むことを期待しています。