日本のMLA連携の方向性を探るラウンドテーブルI

またしてもちょっと前のネタですが(^^;,今回は昨年10月に開催された「日本のMLA連携の方向性を探るラウンドテーブルI」についてです.

仕事の都合で行くことができなかったのですが,フォーラム告知サイトには概要と配布資料がアップされています.また,NDLのカレントアウェアネス-Eには総括が報告されています.その他,いくつかのブログでも感想が述べられているようです.いい時代になってきたなぁ.
 いくつかのブログ記事
このフォーラムは最近博物館情報学界隈でよく耳にする「MLA連携」について,M(Museum),L(Library),A(Archives)それぞれの関係者が集まって課題を整理し,連携に向けて具体的なアクションを起こしていこうという意図のもと開催されたようです.

主催は特定非営利活動法人知的資源イニシアティブ.ryojin3はこの団体を知らなかったのですが,来るべき知識創造社会の基盤データとなる情報資源(図書情報や文化情報,ネット情報等を挙げています)の整備と活用に関する研究・提言・人材交流を行っている団体のようです.

個人的な意見ですが,MLAが持つ情報資源の維持管理には主として利用者の税金や利用料によってまかなわれている場合が多いかと思います.従って,当然ながらMLAは出資者(≒利用者)に対価として質の高いサービスを提供する義務があります.その1つの解として,関係機関と連携し,より幅と奥行きのある情報を提供していこうとする姿勢には賛成です.

また,「人類の知識や文化」を記録・整理・保存し後世に伝えていくというMLAが共通に持つ大きな意義に対しても,相互連携することで「伝えていく」部分により深い理解を与えられそうな気がします.

では具体的にどのように連携するのか.

NDLやブログ記事の報告によれば,その糸口として「コレクション・マネジメント」が話題に上ったようです.コレクション(=収蔵品/図書/公文書 etc.)の収集から利用・廃棄までのフローを見直し,メタデータを整備することで館種を超えた横串の利用を行えるんじゃないかということが書かれています.

月並みと言えば月並みな提案ですが,どのように異なる形式のメタデータを連携させていくのか,どのようなインターフェースを用いてどのようなサービスを提供していくのか,そもそもどのようにメタデータを構築していくのか等,この提案は丁寧に見ていくと多くの技術的課題が含まれています.また,これらの課題は技術に閉じたものではなく,いわゆる一次資料と呼ばれる現物の取り扱いにも関係してきます.

このラウンドテーブルから1ヵ月半後には,アート・ドキュメンテーション学会主催の「MLA連携の現状,課題,そして将来」と題するフォーラムが開催されており,活発な意見交換や研究報告がなされていました.MLA連携が動き出す時期がいよいよ迫っているのかもしれません.

ちなみに,ryojin3はなんとかアート・ドキュメンテーション学会のフォーラムには参加できましたので,そのレポートを次回以降書きたいと思っています.

じんもんこん2009から

昨年12月,じんもんこん2009が立命館大学で開催されました.

じんもんこんとは,情報処理学会人文科学とコンピュータ研究会が主催するシンポジウムで,主に人文科学における情報処理技術全般の研究を対称としています.
毎年気にしているシンポジウムなのですが,年末に開催されることが多いため,仕事と両立することが難しく,ryojin3の出席率はあまり芳しくありません(--;

今回も残念ながら出席はかないませんでしたが,以下の報告が興味深かったので,少しレポートしてみます.

※以下のレポートはryojin3の理解によるところが大きいので,詳細は予稿集でお確かめ下さい.

一般セッション5-A(12/19)
  • 文化資源の電子化における記録情報管理を重視したガイドラインの提案とそれに基づくDigital Cultural Heritageの構築
    • 研谷紀夫(東京大),北岡タマ子(お茶の水女子大),高橋英一(凸版印刷)
東大の研谷氏はトピックマップを用いた人名典拠構築にも取り組んでおり,デジタルアーカイブに関する資料基盤の統合を対象として研究をされています.
今回は,資料基盤の基礎となる「資料のデジタル化」に着目し,凸版印刷と共同でガイドラインの提案とその検証を行っています.

デジタル・ヘリテージ(筆者らは文化資源のデジタル化及び利用に関する全般をこう呼んでいます)構築に必要なフェーズ
  • A. 資料内容調査とデジタル化の計画
  • B. デジタル化
  • C. 評価
  • D. データ管理
  • E. メタデータの構成(F,G,Hの後にも生じる)
  • F. コンテンツ化&パブリッシング
  • G.&H. 学術研究利用+公開
提案されたガイドラインがフォーカスする対象は上記のうちB〜Fであり,各工程において必要となるメタデータスキーマを提案しています.

特に工程Bにおいては,デジタル化に必要な項目を機材別・取得データ別に詳細に項目立てされています.これは,デジタル機器を介して得られるデータからは様々な情報を取得しやすいという状況がある半面,丁寧に取得時の状態を記録しておくことで,後々にデータを再現する必要に迫られた場合,取得当時の状況を限りなく再現可能であるという側面も持ち合わせているのかと思います.

また,工程Cにおける色彩形状評価,工程Dにおける利用・保存を意識したデータ管理,工程Eにおけるメタデータ管理(B〜Dの管理項目をメタデータとして再利用できるよう整理したもの),工程Fにおける利用形態管理,を付与することにより,よりロバストな資料デジタル化工程を確立していると言えます.

今回は提案ガイドラインの評価として,実際に明治期の複数の出版物を統合するデジタル・ヘリテージ構築を行い,ガイドラインが果たした役割と課題を整理しています.

以下に主な役割とその課題についてまとめます.

役割
  • 必要なデータを集約することで対象ヘリテージへの考察がきちんとした根拠に基づいてできた
    • 色彩→複数の出版物・写真・VRコンテンツの差異に対する考察
    • 装飾→図・現在の実物・VRコンテンツの差異に対する考察
  • 具体的な作成記録が取れたので,今後の再現や同様のヘリテージ構築の参考となる 
課題
  • デジタル化のワークフローは対象と目的に応じて都度変化するため,それらに対処できるより柔軟なガイドライン活用が必要
  • ヘリテージ利用のフィードバック(研究考察等)を柔軟に蓄積・コントロールする仕組みが必要
  • 既存のデジタルコンテンツを再利用する際のガイドラインの活用方法の検討
  • 時間とコストを軽減するための自動化施策(ソフトウェアによる対応等)の検討
以下,ryojin3の考察です.

この研究はデジタル・ヘリテージを構築する際に必要となるメタデータを整理して示し,実際に詳細に記録していくことで利用可能なレベルのヘリテージを構築できる点において素晴らしい研究かと思います.

その半面,筆者らも課題として指摘していますが,都度変化するワークフローへの対応や既にデジタル化されている資料への対応等に対して柔軟なコントロールが要求される部分を包括したガイドラインにブラッシュアップされる必要もあるのかと思います.

また,スキーマを眺めていると気付くのですが,記録されるメタデータは作成当時のスクリーンショットに近く,ある時点の情報を1面,スライスしたように記録しています.今後はこのスクリーンショットを(時間的・空間的な情報を取り入れるという意味で)多面的に記録していくことができれば,よりusefulなガイドラインになるのではないでしょうか.

Google×UNESCO

以前,Google earthでプラド美術館を観覧する記事を書きましたが,今度はストリートビューで世界遺産が見られるようになったようです.

一連の国内ニュース記事

Gigazineでは素晴らしい世界遺産旅行(お正月向け?)が公開されています.

この一連のニュースから遡ること約半年,Googleストリートビューでは動物園内や寺院境内を自転車で撮影して施設案内をするパートナープログラムを開始したというニュースもありました.このあたりはVR/ARと博物館にも少し書いてあります.

今回の世界遺産×ストリートビューに自転車撮影が用いられたかどうかはわかりません.しかしながら,現地と地図を拡張現実的に連動させる手法は,現地を訪ねてみたいという動機付けとして十分なものがあると思います.

なお,今回の世界遺産バーチャルツアーはUNESCOとの共同プロジェクトであり,Google/UNESCOのサイトからはGoogle Earth用のkmlファイルもダウンロードできます.

欧州主要国における著作権法制とデジタル図書館調査

今年の初めの情報ですが,情報通信研究機構(NICT)パリ事務所から,「欧州主要国における著作権法制とデジタル図書館調査」という動向報告書が公開(公開日:2009.02.12)されています.


調査の目的は,「欧州デジタル図書館計画」に代表される欧州での公共知識のオンライン化の促進に対し,DRMを中心とする情報技術は何を期待されているのかを考察することだそうです.

そのため,報告書ではまず1)欧州における著作権法制の動向調査及び2)著作権法制と連動して実施される技術動向調査を行っています.更に,具体的なプロジェクトとして3)欧州デジタル図書館における著作権処理の現状と課題について報告しています.

昨年末から今年初頭にかけて,欧州はEuropeana公開という大きな節目の時期でした.ryojin3は文化財や図書のデジタル化・保存と併せて,コンテンツ利用に伴う著作権管理は非常に重要なトピックの一つだと捉えています.実際のサービス事例を踏まえて著作権管理を法制と技術の両面から捉えたこのレポートは欧州の現状を理解する上で意味のあるレポートだと思います.

VR/ARと博物館

博物館情報化の可能性について,VR(Virtual Reality)やAR(Augmented Reality)に代表される仮想技術を中心に考察してみたいと思います.

今年に入り,Second Life上で博物館を実現しようとする動きが出てきています.


Second Lifeについては,MMOGと言われたり,メタバースと言われたり,様々な定義があるようですが,ryojin3はSecond Life=3D仮想空間であり,現実世界で起こる様々な人間活動を投影したバーチャル空間なのだと理解しています.

Second Lifeは2年程前に話題になったサービスですが,当時は操作が難しい・マシンの要求スペックが高い・何をするにもお金がかかる等,いくつかの不人気な理由がありました.近年はこれらの理由に対するいくつかの改善が見られるようで,若干かもしれませんが利用上の障壁は下がってきているかと思います.


また,Second LifeのようにPC上で実現するVRとはまったくアプローチを異にするVRも存在します.例えば,凸版印刷ではシアターに設置した大型のスクリーン(カーブスクリーン,あるいは4Kスクリーン)上に没入感を伴うコンテンツを表示し,コンテンツを閲覧している人間があたかもコンテンツ内部に入り込んでいる状況を作り出すVR作りを行っています.


他にも,科博日本SGIと共同で行ったVR技術を用いた体験型展示の試みや,以前当サイトでもご紹介したGoogle Earth上にプラド美術館を構築する試み,Flash等を用いてWeb上に作られる「バーチャル博物館」等,多くのVR事例が散見されます.


最近,このようなVRの対を成す技術として,(厳密に対を成すかどうか,という定義の議論はさておき・・・)AR(Augmented Reality,拡張現実)技術を博物館に応用しようとする試みもいくつか見受けられるようになってきました.

例えば,以前当サイトでもご紹介しましたが,DNPでは目の前にある文化財とコンピュータ上のバーチャル空間を同期させ,目の前の文化財に関する情報を取得したり,バーチャル空間上で文化財を動かしたりする技術を実験的に実現しています.


同様に,オランダアムステルダムのAllard Pierson Museumでは,"Future For The Past"と題して,古代ローマに関する作品展示に対して,ディスプレイ上に追加情報を提示するMovableScreenというシステムを用いた展示手法を提案しています.元ネタはengadget日本版ですが,これは動画でどうぞ.

MovableScreen at Allard Pierson Museum in Amsterdam


また,何かと話題のGoogleストリートビューでは,最近,所有者のリクエストに基づいて施設内を自転車で撮影する試みが検討されており,文化施設でいうと高台寺旭山動物園では既に先行して撮影が行われているようです.このようなサービスもリアルな施設の画像を仮想地図上にマッピングするという意味で拡張現実と言えるのではないかと思います.


また,現実を強化するという観点では,手術トレーニングや熟練技術の伝承向けに開発されたロボットハンドを用いて,通常触れることが困難な文化財の感触情報を指先に伝える等という応用がなされれば面白い展開があるかもしれません.


博物館の情報化を考える上で,VR/AR技術がもたらす手法は博物館のメインコンテンツ(文化財コンテンツ)を「見せる」手法の新規開拓を意味するので,研究対象としても,ビジネス対象としてもどちらかというと派手でわかりやすく,上記で紹介したもの以外にも面白いの研究やビジネスが数多く行われているかと思います.が,ひとまず紹介はこれくらいにして,博物館の情報化にとってVR/ARがどのような意味を持つのか,ryojin3なりに考察してみたいと思います.

以下,完全に個人的意見です.もっと言うと,ryojin3はVR/ARに関しては専門外なので,世の中の潮流やVR/ARの歴史的背景から外れた考えになってしまっているかもしれません(まぁ,言い訳です).

そもそも,VRやARが発達してきた背景には,シミュレーション,ナビゲーション,法則や動態の可視化,といった人間の理解を補助する必要性が高まったという側面が大きかったからと考えられます.近年では理解の補助のみならず,仮想空間や拡張空間を人間活動の更なる「場」として捉え,「場」上でコミュニケーションを行ったり,コンテンツを享受する環境が整備されつつあるのではないでしょうか.

そう考えると,博物館がVR/AR技術を利用して仮想空間に打って出る状況も理解できます.なぜなら,多くのユーザが彼らのキラーコンテンツである文化財コンテンツを享受できる新しい場が出現しており,そのような場にコンテンツを投入していくことで,ユーザは最終的にホンモノが見たくなり来館する,という相乗効果が期待できるストーリーが成り立つのです.

また,もともと仮想空間には時間と場所の概念がないので,いつでもどこでも好きなときに好きなコンテンツを閲覧することが可能です(もちろん,シアターでのコンテンツ閲覧には制限がありますが).更に,そもそもの理由でもある人間の理解の補助という意味では,コンテンツに付随する多くの関連情報(収蔵品メタデータ)が提供されることで,ユーザは知的好奇心を強く刺激されることとなるのです.

しかし,その一方で,次のようなデメリットも考えられます.つまり,誤解,理解の消化不良,不正な二次利用の助長,が起こりうるということです.

VRはあくまでもホンモノを模した擬似的な世界です.三次元計測技術や色再生技術等を用い,正確に文化財を記述する研究は進んでいますが,印刷された図書のような代替性は持ち合わせていないと考えるのが妥当だと思います(厳密に言えば,図書だってまったく同じモノは世の中に存在しないのですが,複製を作る場合,図書に比べ文化財はより厳密な代替性が求められると言えると思います).そこでは代替性がないことによる誤った理解は避けなければならない.それを補うためにARを用いて多くの関連情報が提供されるのだと考えられますが,そこにも問題があります.多すぎる情報は雑音となり逆に理解の妨げになる場合があるということです.適切なメタデータの設計と配信が考慮されなければならないかと思います.

更に,二次利用を考慮したDRMも整備されなければならないかと思います.仮想空間の「場」としての利用は始まったばかりであり,運営方針や「場」における法整備などがあまり進んでいないように見受けられます.この点に関しては,総務省も取り組みを開始したようです.


博物館にとってVR/ARは研究対象であると共にビジネスの対象であると思います.大きなことを言いますと,日本が,総務省が言うところの「知識・情報経済大国」になるためには,1) より正確な文化財記述の追求,2) 適切なメタデータの設計と配信方式の確立,3) コンテンツの著作権管理 を丁寧にこなしていくことが重要となることと思われます.もちろん,国もそのあたりの施策は考慮しており,総務省のICTビジョン懇親会での中間取りまとめにもその重要性が謳われていますし,文科省主導の「デジタル・ミュージアム実現のための研究開発に向けた要素技術及びシステムに関する調査検討」でもより具体的な検討が行われることと思います.


いやぁ,面白くなりそうですね.

情報知識学会 第17回 2009年度年次大会

先週の土曜日,情報知識学会の年次大会に参加してきました.


今回の研究会は年次大会とあって,26件もの発表があったようです.2教室を使い,セッションがパラレルで走る盛況ぶりでした.ただ,ryojin3は所用があったので,セッションA-1のみ聴講しました.今回は,セッションA-1の中から特に興味深かった発表のみご紹介させて頂きます.

(1) トピックマップを用いた人名典拠情報の構築
 発表者:研谷紀夫(東京大学大学院 情報学環),内藤求(ナレッジ・シナジー)

異名同人・同名異人等の人名典拠情報を管理するために,Topic Mapを用いて関係構造を構築しようとする試みです.Topic Mapはryojin3も関わっているISO/IEC JTC1 SC34のWG3でISO化(pdfが開きます),JIS化(JISX 4157)されており,知識の体系化を目的としています.この発表では,予め人名典拠情報テーブルに基づいて下記のような人名典拠オントロジを構築し,OKS(Ontopia Knowledge Suite)を用いて開発しています.

以下,主なTypesの分類です.

タイプ分類
Topic Types国,人,地名,組織・グループ,職業等
Association Types友人関係,夫婦関係,師弟関係,職場関係,親子関係等
Occurrence Typesよみ(平仮名)名,よみ(平仮名)苗字,ローマ字名,ローマ字苗字,人間関係,関係期間,誕生した地,出典,役職・役割,所属等

人トピックはIRI(Internationalized Resource Identifier)を割り当てることで一意に識別されます.現在は文字列の問題があり,PSI(Published Subject Identifier)公開やRDFとの情報交換については検討中らしいです.

(2) 国内大学図書館におけるデジタルアーカイブの現状
 発表者:鈴木良徳,時実象一(愛知大学文学部)

2005年までデジタルアーカイブ推進協議会が行ってきたデジタルアーカイブ動向調査の続報です.独自にアンケートを行い,国内大学図書館におけるデジタルアーカイブの現状を明らかにしています.

アンケートは,図書館年鑑に基づいて選定された各図書館に対して行われ,Webフォームから回答をもらうという形式を取っています.

アンケートの結果,実施数・保存されている資料数・保存されている資料種類・アーカイブ導入に伴う問題点・著作権処理の実施有無・著作権管理の要望点・標準利用の有無・アーカイブの構築運用体制等について統計的に明らかになった点が多く見受けられます.

また,結論として,デジタルアーカイブが事業としては停滞気味であること,対象物として貴重本が主で,一部博物館・美術館の役割と考えられる絵画/彫刻のアーカイブ化も見られること,予算・人員はもとより,著作権の制約が大きなボトルネックになっていること等が挙げられています.また,デジタルデータの長期保存の観点で考えると,PDF-AやJPEG2000等はまだまだ新しすぎて現場ではあまり導入されていないようです.

(3) 博物館における業務情報の共有とIML (Inter-Museum Loan)システムの可能性
 発表者:田良島哲(国立文化財機構 東京国立博物館)

博物館の学芸業務プロセスの標準化の重要性を,展覧会等の貸借業務を例に論じています.特に,図書館サービスの1つであるILL(Inter-Library Loan,図書館間相互貸借)の考えを発展させ,IML(Inter-Museum Loan)という概念を提案しています.

本文でも触れられていますが,一般的に博物館の業務情報化の話では,MDA(現在は改組してCollections Trust)SPECTRUMが必ずと言っていいほど取り上げられます.国や地域の差異があるので丸ごと利用できるものではありませんが,国内の学芸業務標準化にとって,やはり参考になるようです.

IML(Inter-Museum Loan)とは,貸借業務の「ネットワーク上でのシステム化」のことを指し,主に1)作品・資料自体の移動情報と2)作品・資料の画像情報のネットワークを介した相互利用が想定されています.一言で移動情報と述べましたが,実際に貸借業務を行う場合には,かなり多くのタスクと文書ワークフローをこなすことが要求されるようです.

以下に論文に掲載されていた貸借業務について抜粋しておきます.これは参考になるなぁ.
  • 原則
    • 博物館資料は代替性がない
  • 貸借業務
    • 博物館資料特有の業務
      • 資料の保存状態のチェック
      • 保存状態に基づく輸送及び展示条件の設定
      • 搬送時における借用館または貸出館の職員随伴
      • 搬送・展示に際しての損害保険の付与 etc.
    • 貸借業務時に発生する各種文書処理
      • 貸出の依頼書
      • 借用側の施設環境に関する書類(ファシリティ・レポート)
      • 貸借両館での内部決済書類
      • 貸出の許可書
      • 輸送や保険の契約書
      • 貸出時に取り交わす借用証書
      • 貸付簿
      • 貸出品の状態に関する調書 etc.

デジタル復元

京都・臨済宗大本山建仁寺(東山区)の襖絵「雲龍図」(重文,桃山時代,海北友松筆)4幅(吽形相(うんぎょうそう))がデジタル複製され,5/10まで公開されているようです.
今回のデジタル複製はNPO法人京都文化協会が2007年からキヤノンと3年間の期間限定で進めている文化財未来継承プロジェクト「綴TSUZURI」の一環として制作されたものだそうです.
複製は,原画一幅毎にデジカメで45分割撮影し,合成画像を特殊和紙に出力することで制作されたようです.綴プロジェクトの技術ページには,撮影・印刷・金箔・表具に関する技術について解説がなされています.ここでは,補足的なリンクのみ付けておきます.

ページではさらりと画像の光源ムラ防止や濃度バラつき補正,色調補正,レンズの収差補正等が述べられていますが,一つ一つは相当高い技術が用いられているのでしょう.また,このプロジェクトのために開発された専用和紙ってどんな紙なのか気になりますが,詳細は探せませんでした.一応,Tech On!のニュースによると,コウゾを主原料にミツマタを加えた専用紙らしいです.

撮影技術
印刷技術
金箔

欧州MLAプロジェクトの話

先月,アートドキュメンテーション学会の関西地区部会において欧州におけるMLA動向の報告がありました.
  • 論 題:欧州における図書館・文書館・博物館連携の最新動向:欧州デジタル・プロジェクトを中心に
  • 発表者:菅野育子氏(愛知淑徳大学)
とても参加したかったのですが,ちと場所が遠い…かつ年度末で大忙し…だったので,そのうちネットに報告やブログ感想記事が載るだろうと待っていました.

以下,本日付けでネットから探してきた報告や感想記事です.

案内
報告
感想記事

阿修羅像の輸送技術

2009年3月29日の朝日新聞日曜版の日曜ナントカ学という記事で奈良・興福寺阿修羅像輸送技術について取り上げられていました.3/31の確認ではWeb版のほうではまだ紹介されていないようです.

また,探してみたら何点かニュース記事もありました.

  ※ニュースサイトはすぐページがリンク切れになるのでウェブ魚拓を取りました.

今回の輸送は東京国立博物館で開かれる展覧会に出展するためで,阿修羅像が寺を出るのは約半世紀振りだとか(前回は1952年・東京・日本橋三越で開かれた「奈良春日興福寺国宝展」).しかも,東京の次は福岡・九州国立博物館までお出かけし,奈良に帰るまでに2000キロ近くもの長旅をするそうです.


以前,当サイトでも文化財の輸送について軽く触れましたが,今回も輸送は日通が担当したようです.

今回の輸送技術のポイントは2点,「梱包」と「防振」だそうです.

■梱包
  • 三重構造のアルミボックス
    1. 本体を納める枠
    2. 1の枠を収納する内箱
    3. 2の内箱を収納する外箱
  • 本体(ニュースサイトの写真を見たほうがわかりやすいです)
    • 6本の腕:うす(極薄の中性紙/薄葉紙)を軽く巻き,紙のリボンでとめる
    • 腕下:アルミの添え木を数本配置
    • 腰:うすで保護し,プラスチック素材の緩衝材を巻き,更にさらしを巻く.それをアルミボックスにつながるアクリル板のコルセットでつなぐ
    • 顔:うすを軽く巻く
    • 他の部分:むき出し

■防振
  • 内箱の床下(外箱の床面)6箇所にアイソレータを配置し箱ごと振動を吸収
    • アイソレータ:直径1cmのワイヤーをコイル状にして2本のアルミ棒に巻き付けたもの
  • 当初,アルミボックス各面にアイソレータを取り付けて実験を行ったそうだが,一番振動の吸収ができたのは床面のみに取り付けた状態だった

かつてはミイラ上にぐるぐる巻きにして輸送したそうですが,近年では本体と梱包材が触れ合うことで発生する本体への負荷を軽減することに重点が置かれ,このような梱包・防振技術が適用されているそうです.こういう技術は科学と経験則に裏打ちされたザ・ノウハウと呼べるいい技術だと思います.

情報技術的な観点では,センサを用いた温室度管理,荷の揺れ度合い管理(閾値を超えたらドライバーや管理センターに知らせるとか),GPSを用いた輸送車管理(セキュリティ)等,様々なことが考えられますが,実際にはどれくらいやられているものなのでしょうか.

Dublin Coreの現在

うっかり書き途中でpostしてしまい,一部のRSS Readerでは拾われてしまったかもしれません.こちらが本postです.

先日,久しぶりにディジタル図書館ワークショップに行ってきました.お目当ては何といっても筑波大杉本重雄先生による「Dublin Coreの現在」.午後から別件があったので,今回は午前中のみの参加です.


Dublin Coreの話以外にもマンガメタデータとか研究者リゾルバとか面白そうなネタはたくさんありました.今回は割愛しますが,多分近日中に「ディジタル図書館ワークショップ」情報に掲載されると思われますので,ご興味のある方はそちらをチェックしてみてください.

以下,Dublin Coreに関するメモです.やはり第一人者のお話を聞ける機会は少ないので非常に楽しく,勉強になりました.なお,メモはryojin3の理解によるところが大きいので,詳細は予稿集でお確かめ下さい.

■おさらい
  • メタデータとは
    • Data about data,Structured data about data
    • 記述対象となる情報資源に関して,決められた属性についてその属性値を書き表したもの
  • メタデータの記述規則(メタデータスキーマ)
  • メタデータの作成の実際
    • 具体的な表現形式を決める
    • 記述対象からどのようにして値を抽出するかについての抽出基準を決める

■Dublin Coreの歴史(規格開発系)
(1)開発初期 - 15エレメントの標準化まで
  • 1995年アメリカオハイオ州ダブリン
    • 当初13個のエレメント,すぐに15個に拡張
    • 最小公倍数的メタデータよりも最大公約数的メタデータを目指した
    • ResourceはDocument Like Object(DLO,文書様の実体)と呼ばれていた
  • 1996年イギリスウォーリック
    • Warwick Frameworkが提案
    • 以下はWarwick Frameworkの概念図です.この画像は杉本先生の論文を元に,ryojin3が転記しました
    • Warwick Frameworkは各メタデータ基準(パッケージ)を1つのコンテナに入れるモデルが提案
    • 応用目的に合わせて詳細な記述能力を持つメタデータ基準とDCの組み合わせ
  • 1997年オーストラリアキャンベラ
    • RDFの開発が進んだこともあり,構造表現はRDFにまかせ,構造表現を「持たない」合意がなされる
  • 1997年フィンランドヘルシンキ
    • Simple Dublin Core(「どのエレメントも繰り返し可能であり,かつ省略可能である」という要件を持つDC)の合意
  • 1998年以降(Simple Dublin Coreの標準化)
  • 現在のDublin Core1.1

  • elementelement(和)Namespace
    contributor寄与者(他の関与者)http://purl.org/dc/elements/1.1/contributor
    coverage対象範囲(空間的・時間的)http://purl.org/dc/elements/1.1/coverage
    creator著者あるいは作者http://purl.org/dc/elements/1.1/creator
    date日付http://purl.org/dc/elements/1.1/date
    description内容記述http://purl.org/dc/elements/1.1/description
    format形式(フォーマット)http://purl.org/dc/elements/1.1/format
    identifier資源識別子http://purl.org/dc/elements/1.1/identifier
    language言語http://purl.org/dc/elements/1.1/language
    publisher公開者(出版者)http://purl.org/dc/elements/1.1/publisher
    relation関係http://purl.org/dc/elements/1.1/relation
    rights権利管理http://purl.org/dc/elements/1.1/rights
    source情報源(出処)http://purl.org/dc/elements/1.1/source
    subject主題あるいはキーワードhttp://purl.org/dc/elements/1.1/subject
    titleタイトルhttp://purl.org/dc/elements/1.1/title
    type資源タイプhttp://purl.org/dc/elements/1.1/type

(2)Qualified Dublin Coreの導入,そして更なる概念の明確化
  • 属性の意味の詳細化
    • 日付(一般化)は出版日付か受付日付か有効期限の日付か(詳細化)
  • 属性値の記述形式の指定
    • 日付は 平成21年3月10日か2009-3-10か10/3/2009か
  • QDC:Qualified Dublin Core
    • 詳細化のための最初の属性値
    • 属性値の符号化の限定子
  • 2000年7月にQDCのエレメントセットが決定
    • (a)新しい基本属性の導入
    • (b)既存の属性の意味を詳細化する限定子の導入
    • (c)属性値の記述形式を指定する限定子の認定
    • (a)←→(b)は限定子を取り除けばもとの記述に戻せるDumb-down原則に基づく
  • その後
    • 意味の詳細化としてRDFSが整備され,QDCは使われなくなった
    • 意味の詳細化された属性→「形容詞部分を含む名詞」として属性が定義されていく
    • 符号化形式を表す限定子→値の型を表す属性として定義されていく

(3)Application Profileの概念の明確化
  • 論文:Application profiles: mixing and matching metadata schemas
    • アリモノの推奨
    • Crosswalkをする際のメタデータマッピングを最初からやりやすくすることも目的の1つ
    • 以下の画像はApplication Profileの概念図です.杉本先生の論文を元に,ryojin3が転記しました

■Dublin Coreの歴史(団体(DCMI)系)
(1)開発の初期(~1998年頃まで)

(2)標準化の進展(~2003年頃まで)
  • 組織化
    • Executive Director,Advisory Board,Usage Boardの整備
    • DCMI Metadata RegistryはOCLCから筑波大に移管
  • 議論の場
    • WSが2001年から国際会議になる

(3)組織としての独立

■Dublin Coreの基本15エレメントの再定義
基本的な問題
  • Agentエレメントの導入(1998年,反映されず)
    • Creator,Contributor,Publisherの3エレメントをまとめたもの
    • 3エレメントの意味の違いが明確でなく,かつ15エレメントが広く流通しているので反映されなかった
  • SourceエレメントとRelationエレメント
    • SourceエレメントはRelationエレメントを詳細化したものだが,同じレベルで扱われている
  • 名前空間
    • RDF Schemaにおける名前空間とSimple Dublin Coreの名前空間が統合されないままでいる

再定義

■Abstract Model
  • DCAM:DCMI Abstract Model
    • 2005-03推奨,2007-06改定
    • DCで定義されたメタデータの構造とそれに含まれる様々な意味定義をUMLで書き下したモデル

  • Resource Model
    • リソースの記述がどのような要素から成り立っているかを示す
    • リソース(described resource)は属性(property)と属性値(value)の対(property-value pair)からなる
    • 以下の図はDCMIのサイトから転載しました

  • Description Set Model
    • メタデータがどのような要素から成り立っているかを示す
      • (1)メタデータの実体(record)は1個のdescription setでできている
      • (2)1個のdescription setは1個以上のdescriptionが含まれる

      • (3)1個のdescriptionは記述対象のリソースへの関連付け(described resource URI)と1個以上の文(statement)を持つ
      • (4)1個の文(statement)は属性(property)と属性値(value)の対(property-value pair,Resource Modelに対応)からなる
      • (5)属性値(value)はリテラル(literal value surrogate, 文字列)の場合と非リテラル(non-literal value surrogate,統制語彙か何らかのリソース)の場合がある
      • 以下の図はDCMIのサイトから転載しました

  • Vocabulary Model
    • DCメタデータの語彙に含まれる語の性質とそれらの間の関係を示す
    • 語彙(Vocabulary)に含まれる語(term)は,以下の4つのいずれかとなる
      • 属性(property,domainとrangeをclassに与える)
      • クラス(class)
      • 符号化の構文(syntax encoding scheme)
      • 統制語彙(vocabulary encoding scheme)
      • 以下の図はDCMIのサイトから転載しました

■Application Profileの定義
  • Singapore Framework(Application Profileのフレームワーク)
    • 具体的なシステムやサービスの機能,メタデータ実体,その制約等を明確にするための定義
    • 以下の図はDCMIのサイトから転載しました

  • Functional Requirement
    • Application Profileによって定義されるシステムやサービスにおいて,実現することが必要とされる機能を定義する

  • Domain Model
    • Application Profileによって定義されるシステムやサービスに含まれる基本的な実体と実体間の関係を定義する

  • Description Set Profile
    • Application Profileによって定義されるシステムやサービスにおいて,メタデータの実体(レコード)の構造制約を定義し,適用対象メタデータの妥当性を検証できるようにする

  • Usage Guidelines
    • Application Profileの応用方法や属性の提供方法について示す

  • Encoding Syntax Guidelines
    • Application Profileで示されるメタデータスキーマを特定のシステムやサービスで実現するためのコード化方法やコード化のためのガイドラインを示す

■まとめ
  • この4~5年の進捗
    • 基本15エレメントの再定義
      • DCMIには他に約70のエレメントが登録されている
    • Application Profileの概念の整理
      • Semantic Interoperability(メタデータの意味的相互運用性)を得るための仕組み
    • DCAMによる基礎概念の定義と関係性の明確化
      • Application Profileの概念の明確化と形式的表現の実現

  • レジストリの重要性
    • Application Profileの広がりは,アリモノの利用にあるので,アリモノを見つけるための仕組みとしてメタデータレジストリが重要
    • スキーマの共有と利用するためのコミュニティの活性化が重要