CRM: The CIDOC Conceptual Reference Model(1)

前回,ICOM/CIDOCの取り組み(2)で博物館情報用のデータモデルについて簡単に触れました.特に,「概念参照モデル」(CRM: the CIDOC Conceptual Reference Model)については以下のような説明を加え,

CRMとは,一言で言うと「オントロジを用いた情報記述の枠組み」になります.これまでの提案のようにスキーマ設計の指針(具体的なフィールド名等)となるガイドラインとは異なり,文化財に関する基本概念をオントロジを用いて記述するのです.

オントロジとは,これまた一言で言うならば,「分類体系と推論ルール集」になります.世界にあるモノを体系的に分類し,それらの関係性を記述するものがオントロジです.具体的には諸々の書き方がありますが,CRMではRDF/XMLを利用することになります.

更に,RDF/XMLについてエントリしました.

今回は,RDF/XMLに基づくCRMの詳細について書いてみたいと思います.

CRMの考え方

CRMは,「データベースにどのような情報(フィールド名)を記述すべきか」を言及したものではありません.文化財の管理に対して,既に何らかのデータベースが動いている状態を前提としており,これらのデータベースから,洩れがなく,かつ発見的にデータを統合・交換するための「枠組み」を提供しようというものです.

例えば,ある所蔵品管理データベースでは,管理項目として「作品の名称」「作者」「年代」が管理されているとします.CRMでは,「「作品の名称」は「作者」によって「年代」に作られた」といったような項目間の関係性(RDF/XMLの文)を作り,このデータベースが持つ情報に意味を与えます.他方,別の所蔵品管理データベースでは,「作品の名称」「出処」「関連文献」が管理されているとします.CRMでは「「作品の名称」は「出処」で見つかり,「関連文献」がある」といった関係性を作り,このデータベースが持つ情報に意味を与えます.双方の文をマージすると,「「作者」によって「年代」に作られた「作品の名称」は「出処」で見つかり,「関連文献」がある」という文になり,双方のデータベースが無理なく統合されるわけです.また,それぞれのデータベースから見れば,新たな項目が発見されたとも言えるわけです.

実際にはデータベースはもっと複雑な構造をしており,また管理項目も多種多様です.しかし,概念(上の例ではデータベースの管理項目.ただし概念=管理項目ではない)の関係性を表現し,その関係性を用いてデータの統合や交換の実現を目指したものがCRMと言うことができます.

具体例

では,以下にCRMの例を示します.これはDefinition of the CIDOC CRMのサンプル例を参考に作ったものです.

CRMの最新バージョンは,2008年4月12日現在,4.2.1(あれ? 少し前に調べた時は4.2.2だったような...)で,84のエンティティ,141のプロパティが定義されています.CRMではドメインで使用される概念クラスをエンティティと呼び,エンティティ間の関係をプロパティと呼びます.



この例では,空間情報(文化財の所在)を表現するため,
  • E39 Actor(行為体:個人・グループ等,資料に関わりを持つ人)
  • E51 Contact Point(問い合わせ先:メールアドレスや電話番号,住所等)
  • E41 Appellation(呼称:名称.数値や文字列等)
  • E53 Place(場所)
  • E70 Things(もの:識別可能な単位)
の5つのエンティティを中心に複数のエンティティが階層構造で表現され,かつその関係がプロパティで記述されています.

ツール

CRM本家のToolsでは,各種ツールが公開されています.

可視化ツール(svg file)
  • CRMで定義されるエンティティとプロパティを,ICS-FORTH RDF Suiteを使い,SVGで表現するツール.
  • ブラウザはIE(とAdobe SVG Viewer)を用いないとパースエラーが出るので注意.
  • CRMのバージョンは3.2.
変換ツール
  • XML to RDF translator(zip-file)
    • XMLからRDFに変換するツールを用い,CRMと互換のあるRDFを出力する.
    • コマンドラインベースのツール.シンプルで良さそう.
  • CRM-XML mapping Utility(zip-file)
    • Accessで作られたツール.
    • 設定がよくわからない.設定をスキップして実行しようとしたら OLE サーバと ActiveX コントロールのエラーが出た.
チュートリアル(マッピング関係)
まとめ

今回は,まずCRMの考え方を示しました.次に具体例とツールの説明を交えながら,CRMの概要について書きました.次回は実際にツールを使い,どのようにデータを作っていくのか書いてみたいと思います.

参考文献

  • 本家
    • Definition of the CIDOC CRM
    • Definition of the CIDOC object-oriented Conceptual Reference Model
    • Definition of the CIDOC object-oriented Conceptual Reference Model and Crossreference Manual

0 コメント: