前回,ICOM/CIDOCの取り組み(2)で博物館情報用のデータモデルについて簡単に触れました.特に,「概念参照モデル」(CRM: the CIDOC Conceptual Reference Model)については以下のような説明を加え,
更に,RDF/XMLについてエントリしました.
今回は,RDF/XMLに基づくCRMの詳細について書いてみたいと思います.
CRMの考え方
CRMは,「データベースにどのような情報(フィールド名)を記述すべきか」を言及したものではありません.文化財の管理に対して,既に何らかのデータベースが動いている状態を前提としており,これらのデータベースから,洩れがなく,かつ発見的にデータを統合・交換するための「枠組み」を提供しようというものです.
例えば,ある所蔵品管理データベースでは,管理項目として「作品の名称」「作者」「年代」が管理されているとします.CRMでは,「「作品の名称」は「作者」によって「年代」に作られた」といったような項目間の関係性(RDF/XMLの文)を作り,このデータベースが持つ情報に意味を与えます.他方,別の所蔵品管理データベースでは,「作品の名称」「出処」「関連文献」が管理されているとします.CRMでは「「作品の名称」は「出処」で見つかり,「関連文献」がある」といった関係性を作り,このデータベースが持つ情報に意味を与えます.双方の文をマージすると,「「作者」によって「年代」に作られた「作品の名称」は「出処」で見つかり,「関連文献」がある」という文になり,双方のデータベースが無理なく統合されるわけです.また,それぞれのデータベースから見れば,新たな項目が発見されたとも言えるわけです.
実際にはデータベースはもっと複雑な構造をしており,また管理項目も多種多様です.しかし,概念(上の例ではデータベースの管理項目.ただし概念=管理項目ではない)の関係性を表現し,その関係性を用いてデータの統合や交換の実現を目指したものがCRMと言うことができます.
具体例
では,以下にCRMの例を示します.これはDefinition of the CIDOC CRMのサンプル例を参考に作ったものです.
CRMの最新バージョンは,2008年4月12日現在,4.2.1(あれ? 少し前に調べた時は4.2.2だったような...)で,84のエンティティ,141のプロパティが定義されています.CRMではドメインで使用される概念クラスをエンティティと呼び,エンティティ間の関係をプロパティと呼びます.

この例では,空間情報(文化財の所在)を表現するため,
ツール
CRM本家のToolsでは,各種ツールが公開されています.
可視化ツール(svg file)
今回は,まずCRMの考え方を示しました.次に具体例とツールの説明を交えながら,CRMの概要について書きました.次回は実際にツールを使い,どのようにデータを作っていくのか書いてみたいと思います.
参考文献
CRMとは,一言で言うと「オントロジを用いた情報記述の枠組み」になります.これまでの提案のようにスキーマ設計の指針(具体的なフィールド名等)となるガイドラインとは異なり,文化財に関する基本概念をオントロジを用いて記述するのです.
オントロジとは,これまた一言で言うならば,「分類体系と推論ルール集」になります.世界にあるモノを体系的に分類し,それらの関係性を記述するものがオントロジです.具体的には諸々の書き方がありますが,CRMではRDF/XMLを利用することになります.
更に,RDF/XMLについてエントリしました.
今回は,RDF/XMLに基づくCRMの詳細について書いてみたいと思います.
CRMの考え方
CRMは,「データベースにどのような情報(フィールド名)を記述すべきか」を言及したものではありません.文化財の管理に対して,既に何らかのデータベースが動いている状態を前提としており,これらのデータベースから,洩れがなく,かつ発見的にデータを統合・交換するための「枠組み」を提供しようというものです.
例えば,ある所蔵品管理データベースでは,管理項目として「作品の名称」「作者」「年代」が管理されているとします.CRMでは,「「作品の名称」は「作者」によって「年代」に作られた」といったような項目間の関係性(RDF/XMLの文)を作り,このデータベースが持つ情報に意味を与えます.他方,別の所蔵品管理データベースでは,「作品の名称」「出処」「関連文献」が管理されているとします.CRMでは「「作品の名称」は「出処」で見つかり,「関連文献」がある」といった関係性を作り,このデータベースが持つ情報に意味を与えます.双方の文をマージすると,「「作者」によって「年代」に作られた「作品の名称」は「出処」で見つかり,「関連文献」がある」という文になり,双方のデータベースが無理なく統合されるわけです.また,それぞれのデータベースから見れば,新たな項目が発見されたとも言えるわけです.
実際にはデータベースはもっと複雑な構造をしており,また管理項目も多種多様です.しかし,概念(上の例ではデータベースの管理項目.ただし概念=管理項目ではない)の関係性を表現し,その関係性を用いてデータの統合や交換の実現を目指したものがCRMと言うことができます.
具体例
では,以下にCRMの例を示します.これはDefinition of the CIDOC CRMのサンプル例を参考に作ったものです.
CRMの最新バージョンは,2008年4月12日現在,4.2.1(あれ? 少し前に調べた時は4.2.2だったような...)で,84のエンティティ,141のプロパティが定義されています.CRMではドメインで使用される概念クラスをエンティティと呼び,エンティティ間の関係をプロパティと呼びます.

この例では,空間情報(文化財の所在)を表現するため,
- E39 Actor(行為体:個人・グループ等,資料に関わりを持つ人)
- E51 Contact Point(問い合わせ先:メールアドレスや電話番号,住所等)
- E41 Appellation(呼称:名称.数値や文字列等)
- E53 Place(場所)
- E70 Things(もの:識別可能な単位)
ツール
CRM本家のToolsでは,各種ツールが公開されています.
可視化ツール(svg file)
- CRMで定義されるエンティティとプロパティを,ICS-FORTH RDF Suiteを使い,SVGで表現するツール.
- ブラウザはIE(とAdobe SVG Viewer)を用いないとパースエラーが出るので注意.
- CRMのバージョンは3.2.
- XML to RDF translator(zip-file)
- XMLからRDFに変換するツールを用い,CRMと互換のあるRDFを出力する.
- コマンドラインベースのツール.シンプルで良さそう.
- CRM-XML mapping Utility(zip-file)
- Accessで作られたツール.
- 設定がよくわからない.設定をスキップして実行しようとしたら OLE サーバと ActiveX コントロールのエラーが出た.
- the mappings of the CRM
- DTDへのマッピングについて.
- the Data Transformations
- マッピングそのものの理解について.
- rtf file, pdf file
- CRMのデータ構造のためのマッピング形式について.
今回は,まずCRMの考え方を示しました.次に具体例とツールの説明を交えながら,CRMの概要について書きました.次回は実際にツールを使い,どのようにデータを作っていくのか書いてみたいと思います.
参考文献
- 本家
- Definition of the CIDOC CRM
- Definition of the CIDOC object-oriented Conceptual Reference Model
- Definition of the CIDOC object-oriented Conceptual Reference Model and Crossreference Manual
- ICOM CIDOC編, 鯨井秀伸訳. 文化遺産情報のData ModelとCRM. 初版, 勉誠出版, 2003, 311p.
- 村田良二: "CIDOC CRMによるデータモデル", アート・ドキュメンテーション研究, No.11, pp. 49-60, 2004.
- 秋元良仁. 文化財メタデータの構築. 映像情報メディア学会誌. Vol.61, No.11, 2007, pp.1578-1581
- CIDOC CRM モデリング入門
0 コメント:
コメントを投稿