欧州主要国における著作権法制とデジタル図書館調査

今年の初めの情報ですが,情報通信研究機構(NICT)パリ事務所から,「欧州主要国における著作権法制とデジタル図書館調査」という動向報告書が公開(公開日:2009.02.12)されています.


調査の目的は,「欧州デジタル図書館計画」に代表される欧州での公共知識のオンライン化の促進に対し,DRMを中心とする情報技術は何を期待されているのかを考察することだそうです.

そのため,報告書ではまず1)欧州における著作権法制の動向調査及び2)著作権法制と連動して実施される技術動向調査を行っています.更に,具体的なプロジェクトとして3)欧州デジタル図書館における著作権処理の現状と課題について報告しています.

昨年末から今年初頭にかけて,欧州はEuropeana公開という大きな節目の時期でした.ryojin3は文化財や図書のデジタル化・保存と併せて,コンテンツ利用に伴う著作権管理は非常に重要なトピックの一つだと捉えています.実際のサービス事例を踏まえて著作権管理を法制と技術の両面から捉えたこのレポートは欧州の現状を理解する上で意味のあるレポートだと思います.

VR/ARと博物館

博物館情報化の可能性について,VR(Virtual Reality)やAR(Augmented Reality)に代表される仮想技術を中心に考察してみたいと思います.

今年に入り,Second Life上で博物館を実現しようとする動きが出てきています.


Second Lifeについては,MMOGと言われたり,メタバースと言われたり,様々な定義があるようですが,ryojin3はSecond Life=3D仮想空間であり,現実世界で起こる様々な人間活動を投影したバーチャル空間なのだと理解しています.

Second Lifeは2年程前に話題になったサービスですが,当時は操作が難しい・マシンの要求スペックが高い・何をするにもお金がかかる等,いくつかの不人気な理由がありました.近年はこれらの理由に対するいくつかの改善が見られるようで,若干かもしれませんが利用上の障壁は下がってきているかと思います.


また,Second LifeのようにPC上で実現するVRとはまったくアプローチを異にするVRも存在します.例えば,凸版印刷ではシアターに設置した大型のスクリーン(カーブスクリーン,あるいは4Kスクリーン)上に没入感を伴うコンテンツを表示し,コンテンツを閲覧している人間があたかもコンテンツ内部に入り込んでいる状況を作り出すVR作りを行っています.


他にも,科博日本SGIと共同で行ったVR技術を用いた体験型展示の試みや,以前当サイトでもご紹介したGoogle Earth上にプラド美術館を構築する試み,Flash等を用いてWeb上に作られる「バーチャル博物館」等,多くのVR事例が散見されます.


最近,このようなVRの対を成す技術として,(厳密に対を成すかどうか,という定義の議論はさておき・・・)AR(Augmented Reality,拡張現実)技術を博物館に応用しようとする試みもいくつか見受けられるようになってきました.

例えば,以前当サイトでもご紹介しましたが,DNPでは目の前にある文化財とコンピュータ上のバーチャル空間を同期させ,目の前の文化財に関する情報を取得したり,バーチャル空間上で文化財を動かしたりする技術を実験的に実現しています.


同様に,オランダアムステルダムのAllard Pierson Museumでは,"Future For The Past"と題して,古代ローマに関する作品展示に対して,ディスプレイ上に追加情報を提示するMovableScreenというシステムを用いた展示手法を提案しています.元ネタはengadget日本版ですが,これは動画でどうぞ.

MovableScreen at Allard Pierson Museum in Amsterdam


また,何かと話題のGoogleストリートビューでは,最近,所有者のリクエストに基づいて施設内を自転車で撮影する試みが検討されており,文化施設でいうと高台寺旭山動物園では既に先行して撮影が行われているようです.このようなサービスもリアルな施設の画像を仮想地図上にマッピングするという意味で拡張現実と言えるのではないかと思います.


また,現実を強化するという観点では,手術トレーニングや熟練技術の伝承向けに開発されたロボットハンドを用いて,通常触れることが困難な文化財の感触情報を指先に伝える等という応用がなされれば面白い展開があるかもしれません.


博物館の情報化を考える上で,VR/AR技術がもたらす手法は博物館のメインコンテンツ(文化財コンテンツ)を「見せる」手法の新規開拓を意味するので,研究対象としても,ビジネス対象としてもどちらかというと派手でわかりやすく,上記で紹介したもの以外にも面白いの研究やビジネスが数多く行われているかと思います.が,ひとまず紹介はこれくらいにして,博物館の情報化にとってVR/ARがどのような意味を持つのか,ryojin3なりに考察してみたいと思います.

以下,完全に個人的意見です.もっと言うと,ryojin3はVR/ARに関しては専門外なので,世の中の潮流やVR/ARの歴史的背景から外れた考えになってしまっているかもしれません(まぁ,言い訳です).

そもそも,VRやARが発達してきた背景には,シミュレーション,ナビゲーション,法則や動態の可視化,といった人間の理解を補助する必要性が高まったという側面が大きかったからと考えられます.近年では理解の補助のみならず,仮想空間や拡張空間を人間活動の更なる「場」として捉え,「場」上でコミュニケーションを行ったり,コンテンツを享受する環境が整備されつつあるのではないでしょうか.

そう考えると,博物館がVR/AR技術を利用して仮想空間に打って出る状況も理解できます.なぜなら,多くのユーザが彼らのキラーコンテンツである文化財コンテンツを享受できる新しい場が出現しており,そのような場にコンテンツを投入していくことで,ユーザは最終的にホンモノが見たくなり来館する,という相乗効果が期待できるストーリーが成り立つのです.

また,もともと仮想空間には時間と場所の概念がないので,いつでもどこでも好きなときに好きなコンテンツを閲覧することが可能です(もちろん,シアターでのコンテンツ閲覧には制限がありますが).更に,そもそもの理由でもある人間の理解の補助という意味では,コンテンツに付随する多くの関連情報(収蔵品メタデータ)が提供されることで,ユーザは知的好奇心を強く刺激されることとなるのです.

しかし,その一方で,次のようなデメリットも考えられます.つまり,誤解,理解の消化不良,不正な二次利用の助長,が起こりうるということです.

VRはあくまでもホンモノを模した擬似的な世界です.三次元計測技術や色再生技術等を用い,正確に文化財を記述する研究は進んでいますが,印刷された図書のような代替性は持ち合わせていないと考えるのが妥当だと思います(厳密に言えば,図書だってまったく同じモノは世の中に存在しないのですが,複製を作る場合,図書に比べ文化財はより厳密な代替性が求められると言えると思います).そこでは代替性がないことによる誤った理解は避けなければならない.それを補うためにARを用いて多くの関連情報が提供されるのだと考えられますが,そこにも問題があります.多すぎる情報は雑音となり逆に理解の妨げになる場合があるということです.適切なメタデータの設計と配信が考慮されなければならないかと思います.

更に,二次利用を考慮したDRMも整備されなければならないかと思います.仮想空間の「場」としての利用は始まったばかりであり,運営方針や「場」における法整備などがあまり進んでいないように見受けられます.この点に関しては,総務省も取り組みを開始したようです.


博物館にとってVR/ARは研究対象であると共にビジネスの対象であると思います.大きなことを言いますと,日本が,総務省が言うところの「知識・情報経済大国」になるためには,1) より正確な文化財記述の追求,2) 適切なメタデータの設計と配信方式の確立,3) コンテンツの著作権管理 を丁寧にこなしていくことが重要となることと思われます.もちろん,国もそのあたりの施策は考慮しており,総務省のICTビジョン懇親会での中間取りまとめにもその重要性が謳われていますし,文科省主導の「デジタル・ミュージアム実現のための研究開発に向けた要素技術及びシステムに関する調査検討」でもより具体的な検討が行われることと思います.


いやぁ,面白くなりそうですね.

情報知識学会 第17回 2009年度年次大会

先週の土曜日,情報知識学会の年次大会に参加してきました.


今回の研究会は年次大会とあって,26件もの発表があったようです.2教室を使い,セッションがパラレルで走る盛況ぶりでした.ただ,ryojin3は所用があったので,セッションA-1のみ聴講しました.今回は,セッションA-1の中から特に興味深かった発表のみご紹介させて頂きます.

(1) トピックマップを用いた人名典拠情報の構築
 発表者:研谷紀夫(東京大学大学院 情報学環),内藤求(ナレッジ・シナジー)

異名同人・同名異人等の人名典拠情報を管理するために,Topic Mapを用いて関係構造を構築しようとする試みです.Topic Mapはryojin3も関わっているISO/IEC JTC1 SC34のWG3でISO化(pdfが開きます),JIS化(JISX 4157)されており,知識の体系化を目的としています.この発表では,予め人名典拠情報テーブルに基づいて下記のような人名典拠オントロジを構築し,OKS(Ontopia Knowledge Suite)を用いて開発しています.

以下,主なTypesの分類です.

タイプ分類
Topic Types国,人,地名,組織・グループ,職業等
Association Types友人関係,夫婦関係,師弟関係,職場関係,親子関係等
Occurrence Typesよみ(平仮名)名,よみ(平仮名)苗字,ローマ字名,ローマ字苗字,人間関係,関係期間,誕生した地,出典,役職・役割,所属等

人トピックはIRI(Internationalized Resource Identifier)を割り当てることで一意に識別されます.現在は文字列の問題があり,PSI(Published Subject Identifier)公開やRDFとの情報交換については検討中らしいです.

(2) 国内大学図書館におけるデジタルアーカイブの現状
 発表者:鈴木良徳,時実象一(愛知大学文学部)

2005年までデジタルアーカイブ推進協議会が行ってきたデジタルアーカイブ動向調査の続報です.独自にアンケートを行い,国内大学図書館におけるデジタルアーカイブの現状を明らかにしています.

アンケートは,図書館年鑑に基づいて選定された各図書館に対して行われ,Webフォームから回答をもらうという形式を取っています.

アンケートの結果,実施数・保存されている資料数・保存されている資料種類・アーカイブ導入に伴う問題点・著作権処理の実施有無・著作権管理の要望点・標準利用の有無・アーカイブの構築運用体制等について統計的に明らかになった点が多く見受けられます.

また,結論として,デジタルアーカイブが事業としては停滞気味であること,対象物として貴重本が主で,一部博物館・美術館の役割と考えられる絵画/彫刻のアーカイブ化も見られること,予算・人員はもとより,著作権の制約が大きなボトルネックになっていること等が挙げられています.また,デジタルデータの長期保存の観点で考えると,PDF-AやJPEG2000等はまだまだ新しすぎて現場ではあまり導入されていないようです.

(3) 博物館における業務情報の共有とIML (Inter-Museum Loan)システムの可能性
 発表者:田良島哲(国立文化財機構 東京国立博物館)

博物館の学芸業務プロセスの標準化の重要性を,展覧会等の貸借業務を例に論じています.特に,図書館サービスの1つであるILL(Inter-Library Loan,図書館間相互貸借)の考えを発展させ,IML(Inter-Museum Loan)という概念を提案しています.

本文でも触れられていますが,一般的に博物館の業務情報化の話では,MDA(現在は改組してCollections Trust)SPECTRUMが必ずと言っていいほど取り上げられます.国や地域の差異があるので丸ごと利用できるものではありませんが,国内の学芸業務標準化にとって,やはり参考になるようです.

IML(Inter-Museum Loan)とは,貸借業務の「ネットワーク上でのシステム化」のことを指し,主に1)作品・資料自体の移動情報と2)作品・資料の画像情報のネットワークを介した相互利用が想定されています.一言で移動情報と述べましたが,実際に貸借業務を行う場合には,かなり多くのタスクと文書ワークフローをこなすことが要求されるようです.

以下に論文に掲載されていた貸借業務について抜粋しておきます.これは参考になるなぁ.
  • 原則
    • 博物館資料は代替性がない
  • 貸借業務
    • 博物館資料特有の業務
      • 資料の保存状態のチェック
      • 保存状態に基づく輸送及び展示条件の設定
      • 搬送時における借用館または貸出館の職員随伴
      • 搬送・展示に際しての損害保険の付与 etc.
    • 貸借業務時に発生する各種文書処理
      • 貸出の依頼書
      • 借用側の施設環境に関する書類(ファシリティ・レポート)
      • 貸借両館での内部決済書類
      • 貸出の許可書
      • 輸送や保険の契約書
      • 貸出時に取り交わす借用証書
      • 貸付簿
      • 貸出品の状態に関する調書 etc.

デジタル復元

京都・臨済宗大本山建仁寺(東山区)の襖絵「雲龍図」(重文,桃山時代,海北友松筆)4幅(吽形相(うんぎょうそう))がデジタル複製され,5/10まで公開されているようです.
今回のデジタル複製はNPO法人京都文化協会が2007年からキヤノンと3年間の期間限定で進めている文化財未来継承プロジェクト「綴TSUZURI」の一環として制作されたものだそうです.
複製は,原画一幅毎にデジカメで45分割撮影し,合成画像を特殊和紙に出力することで制作されたようです.綴プロジェクトの技術ページには,撮影・印刷・金箔・表具に関する技術について解説がなされています.ここでは,補足的なリンクのみ付けておきます.

ページではさらりと画像の光源ムラ防止や濃度バラつき補正,色調補正,レンズの収差補正等が述べられていますが,一つ一つは相当高い技術が用いられているのでしょう.また,このプロジェクトのために開発された専用和紙ってどんな紙なのか気になりますが,詳細は探せませんでした.一応,Tech On!のニュースによると,コウゾを主原料にミツマタを加えた専用紙らしいです.

撮影技術
印刷技術
金箔

欧州MLAプロジェクトの話

先月,アートドキュメンテーション学会の関西地区部会において欧州におけるMLA動向の報告がありました.
  • 論 題:欧州における図書館・文書館・博物館連携の最新動向:欧州デジタル・プロジェクトを中心に
  • 発表者:菅野育子氏(愛知淑徳大学)
とても参加したかったのですが,ちと場所が遠い…かつ年度末で大忙し…だったので,そのうちネットに報告やブログ感想記事が載るだろうと待っていました.

以下,本日付けでネットから探してきた報告や感想記事です.

案内
報告
感想記事

阿修羅像の輸送技術

2009年3月29日の朝日新聞日曜版の日曜ナントカ学という記事で奈良・興福寺阿修羅像輸送技術について取り上げられていました.3/31の確認ではWeb版のほうではまだ紹介されていないようです.

また,探してみたら何点かニュース記事もありました.

  ※ニュースサイトはすぐページがリンク切れになるのでウェブ魚拓を取りました.

今回の輸送は東京国立博物館で開かれる展覧会に出展するためで,阿修羅像が寺を出るのは約半世紀振りだとか(前回は1952年・東京・日本橋三越で開かれた「奈良春日興福寺国宝展」).しかも,東京の次は福岡・九州国立博物館までお出かけし,奈良に帰るまでに2000キロ近くもの長旅をするそうです.


以前,当サイトでも文化財の輸送について軽く触れましたが,今回も輸送は日通が担当したようです.

今回の輸送技術のポイントは2点,「梱包」と「防振」だそうです.

■梱包
  • 三重構造のアルミボックス
    1. 本体を納める枠
    2. 1の枠を収納する内箱
    3. 2の内箱を収納する外箱
  • 本体(ニュースサイトの写真を見たほうがわかりやすいです)
    • 6本の腕:うす(極薄の中性紙/薄葉紙)を軽く巻き,紙のリボンでとめる
    • 腕下:アルミの添え木を数本配置
    • 腰:うすで保護し,プラスチック素材の緩衝材を巻き,更にさらしを巻く.それをアルミボックスにつながるアクリル板のコルセットでつなぐ
    • 顔:うすを軽く巻く
    • 他の部分:むき出し

■防振
  • 内箱の床下(外箱の床面)6箇所にアイソレータを配置し箱ごと振動を吸収
    • アイソレータ:直径1cmのワイヤーをコイル状にして2本のアルミ棒に巻き付けたもの
  • 当初,アルミボックス各面にアイソレータを取り付けて実験を行ったそうだが,一番振動の吸収ができたのは床面のみに取り付けた状態だった

かつてはミイラ上にぐるぐる巻きにして輸送したそうですが,近年では本体と梱包材が触れ合うことで発生する本体への負荷を軽減することに重点が置かれ,このような梱包・防振技術が適用されているそうです.こういう技術は科学と経験則に裏打ちされたザ・ノウハウと呼べるいい技術だと思います.

情報技術的な観点では,センサを用いた温室度管理,荷の揺れ度合い管理(閾値を超えたらドライバーや管理センターに知らせるとか),GPSを用いた輸送車管理(セキュリティ)等,様々なことが考えられますが,実際にはどれくらいやられているものなのでしょうか.

Dublin Coreの現在

うっかり書き途中でpostしてしまい,一部のRSS Readerでは拾われてしまったかもしれません.こちらが本postです.

先日,久しぶりにディジタル図書館ワークショップに行ってきました.お目当ては何といっても筑波大杉本重雄先生による「Dublin Coreの現在」.午後から別件があったので,今回は午前中のみの参加です.


Dublin Coreの話以外にもマンガメタデータとか研究者リゾルバとか面白そうなネタはたくさんありました.今回は割愛しますが,多分近日中に「ディジタル図書館ワークショップ」情報に掲載されると思われますので,ご興味のある方はそちらをチェックしてみてください.

以下,Dublin Coreに関するメモです.やはり第一人者のお話を聞ける機会は少ないので非常に楽しく,勉強になりました.なお,メモはryojin3の理解によるところが大きいので,詳細は予稿集でお確かめ下さい.

■おさらい
  • メタデータとは
    • Data about data,Structured data about data
    • 記述対象となる情報資源に関して,決められた属性についてその属性値を書き表したもの
  • メタデータの記述規則(メタデータスキーマ)
  • メタデータの作成の実際
    • 具体的な表現形式を決める
    • 記述対象からどのようにして値を抽出するかについての抽出基準を決める

■Dublin Coreの歴史(規格開発系)
(1)開発初期 - 15エレメントの標準化まで
  • 1995年アメリカオハイオ州ダブリン
    • 当初13個のエレメント,すぐに15個に拡張
    • 最小公倍数的メタデータよりも最大公約数的メタデータを目指した
    • ResourceはDocument Like Object(DLO,文書様の実体)と呼ばれていた
  • 1996年イギリスウォーリック
    • Warwick Frameworkが提案
    • 以下はWarwick Frameworkの概念図です.この画像は杉本先生の論文を元に,ryojin3が転記しました
    • Warwick Frameworkは各メタデータ基準(パッケージ)を1つのコンテナに入れるモデルが提案
    • 応用目的に合わせて詳細な記述能力を持つメタデータ基準とDCの組み合わせ
  • 1997年オーストラリアキャンベラ
    • RDFの開発が進んだこともあり,構造表現はRDFにまかせ,構造表現を「持たない」合意がなされる
  • 1997年フィンランドヘルシンキ
    • Simple Dublin Core(「どのエレメントも繰り返し可能であり,かつ省略可能である」という要件を持つDC)の合意
  • 1998年以降(Simple Dublin Coreの標準化)
  • 現在のDublin Core1.1

  • elementelement(和)Namespace
    contributor寄与者(他の関与者)http://purl.org/dc/elements/1.1/contributor
    coverage対象範囲(空間的・時間的)http://purl.org/dc/elements/1.1/coverage
    creator著者あるいは作者http://purl.org/dc/elements/1.1/creator
    date日付http://purl.org/dc/elements/1.1/date
    description内容記述http://purl.org/dc/elements/1.1/description
    format形式(フォーマット)http://purl.org/dc/elements/1.1/format
    identifier資源識別子http://purl.org/dc/elements/1.1/identifier
    language言語http://purl.org/dc/elements/1.1/language
    publisher公開者(出版者)http://purl.org/dc/elements/1.1/publisher
    relation関係http://purl.org/dc/elements/1.1/relation
    rights権利管理http://purl.org/dc/elements/1.1/rights
    source情報源(出処)http://purl.org/dc/elements/1.1/source
    subject主題あるいはキーワードhttp://purl.org/dc/elements/1.1/subject
    titleタイトルhttp://purl.org/dc/elements/1.1/title
    type資源タイプhttp://purl.org/dc/elements/1.1/type

(2)Qualified Dublin Coreの導入,そして更なる概念の明確化
  • 属性の意味の詳細化
    • 日付(一般化)は出版日付か受付日付か有効期限の日付か(詳細化)
  • 属性値の記述形式の指定
    • 日付は 平成21年3月10日か2009-3-10か10/3/2009か
  • QDC:Qualified Dublin Core
    • 詳細化のための最初の属性値
    • 属性値の符号化の限定子
  • 2000年7月にQDCのエレメントセットが決定
    • (a)新しい基本属性の導入
    • (b)既存の属性の意味を詳細化する限定子の導入
    • (c)属性値の記述形式を指定する限定子の認定
    • (a)←→(b)は限定子を取り除けばもとの記述に戻せるDumb-down原則に基づく
  • その後
    • 意味の詳細化としてRDFSが整備され,QDCは使われなくなった
    • 意味の詳細化された属性→「形容詞部分を含む名詞」として属性が定義されていく
    • 符号化形式を表す限定子→値の型を表す属性として定義されていく

(3)Application Profileの概念の明確化
  • 論文:Application profiles: mixing and matching metadata schemas
    • アリモノの推奨
    • Crosswalkをする際のメタデータマッピングを最初からやりやすくすることも目的の1つ
    • 以下の画像はApplication Profileの概念図です.杉本先生の論文を元に,ryojin3が転記しました

■Dublin Coreの歴史(団体(DCMI)系)
(1)開発の初期(~1998年頃まで)

(2)標準化の進展(~2003年頃まで)
  • 組織化
    • Executive Director,Advisory Board,Usage Boardの整備
    • DCMI Metadata RegistryはOCLCから筑波大に移管
  • 議論の場
    • WSが2001年から国際会議になる

(3)組織としての独立

■Dublin Coreの基本15エレメントの再定義
基本的な問題
  • Agentエレメントの導入(1998年,反映されず)
    • Creator,Contributor,Publisherの3エレメントをまとめたもの
    • 3エレメントの意味の違いが明確でなく,かつ15エレメントが広く流通しているので反映されなかった
  • SourceエレメントとRelationエレメント
    • SourceエレメントはRelationエレメントを詳細化したものだが,同じレベルで扱われている
  • 名前空間
    • RDF Schemaにおける名前空間とSimple Dublin Coreの名前空間が統合されないままでいる

再定義

■Abstract Model
  • DCAM:DCMI Abstract Model
    • 2005-03推奨,2007-06改定
    • DCで定義されたメタデータの構造とそれに含まれる様々な意味定義をUMLで書き下したモデル

  • Resource Model
    • リソースの記述がどのような要素から成り立っているかを示す
    • リソース(described resource)は属性(property)と属性値(value)の対(property-value pair)からなる
    • 以下の図はDCMIのサイトから転載しました

  • Description Set Model
    • メタデータがどのような要素から成り立っているかを示す
      • (1)メタデータの実体(record)は1個のdescription setでできている
      • (2)1個のdescription setは1個以上のdescriptionが含まれる

      • (3)1個のdescriptionは記述対象のリソースへの関連付け(described resource URI)と1個以上の文(statement)を持つ
      • (4)1個の文(statement)は属性(property)と属性値(value)の対(property-value pair,Resource Modelに対応)からなる
      • (5)属性値(value)はリテラル(literal value surrogate, 文字列)の場合と非リテラル(non-literal value surrogate,統制語彙か何らかのリソース)の場合がある
      • 以下の図はDCMIのサイトから転載しました

  • Vocabulary Model
    • DCメタデータの語彙に含まれる語の性質とそれらの間の関係を示す
    • 語彙(Vocabulary)に含まれる語(term)は,以下の4つのいずれかとなる
      • 属性(property,domainとrangeをclassに与える)
      • クラス(class)
      • 符号化の構文(syntax encoding scheme)
      • 統制語彙(vocabulary encoding scheme)
      • 以下の図はDCMIのサイトから転載しました

■Application Profileの定義
  • Singapore Framework(Application Profileのフレームワーク)
    • 具体的なシステムやサービスの機能,メタデータ実体,その制約等を明確にするための定義
    • 以下の図はDCMIのサイトから転載しました

  • Functional Requirement
    • Application Profileによって定義されるシステムやサービスにおいて,実現することが必要とされる機能を定義する

  • Domain Model
    • Application Profileによって定義されるシステムやサービスに含まれる基本的な実体と実体間の関係を定義する

  • Description Set Profile
    • Application Profileによって定義されるシステムやサービスにおいて,メタデータの実体(レコード)の構造制約を定義し,適用対象メタデータの妥当性を検証できるようにする

  • Usage Guidelines
    • Application Profileの応用方法や属性の提供方法について示す

  • Encoding Syntax Guidelines
    • Application Profileで示されるメタデータスキーマを特定のシステムやサービスで実現するためのコード化方法やコード化のためのガイドラインを示す

■まとめ
  • この4~5年の進捗
    • 基本15エレメントの再定義
      • DCMIには他に約70のエレメントが登録されている
    • Application Profileの概念の整理
      • Semantic Interoperability(メタデータの意味的相互運用性)を得るための仕組み
    • DCAMによる基礎概念の定義と関係性の明確化
      • Application Profileの概念の明確化と形式的表現の実現

  • レジストリの重要性
    • Application Profileの広がりは,アリモノの利用にあるので,アリモノを見つけるための仕組みとしてメタデータレジストリが重要
    • スキーマの共有と利用するためのコミュニティの活性化が重要

研究記録のアーカイブズ

日本アーカイブズ学会 国文学研究資料館アーカイブズ研究系研究プロジェクト 「研究記録のアーカイブズ ―研究過程の検証と新たな情報資源化のために―」に参加してきました.

今回は場所が自宅に近いということもあり,ゆるゆるとお昼を食べてからの出陣でした.多摩都市モノレール・高松駅付近は誘致も進めているのでしょうか,国の研究機関が多く今後発展しそうな雰囲気のある場所でした.
  • 日時
    • 2009年2月21日(土)13:30-17:00
  • 場所
    • 人間文化研究機構国文学研究資料館 2F 大会議室
  • 参加
    • 4~50名
まずは事務局から主旨説明
  • 研究過程アーカイブの重要性
    • 過程を明確にすることによる,研究の不正防止
    • 過程を明確にすることによる,研究の説明責任
    • 過程アーカイブからの新たなテーマ創出
  • 今回は,社会科学・自然科学・人文科学それぞれの「研究過程アーカイブ」について議論

1. 実証的社会科学研究とデータアーカイブの役割
  • 主旨
    • 社会調査におけるマイクロデータのデータアーカイブの話
      • マイクロデータとは,社会調査時の集計前のデータ.コンピュータ処理が可能なもの
  • 目的
    • マイクロデータのアーカイブ化・共通利用化
    • 仮説検証プロセスの明確化
    • 検証時間の短縮
    • 若手・海外研究者向けとしても活用
  • 背景
    • 日本ではマイクロデータの2次利用はあまり広がっていない
      • マスコミ等の企業は非公開にしたがる
      • 調査会社は契約上公開できない場合がある
      • 近年では個人レベル・特定分野で公開が広がってきている
    • 統計法の改正(2009.04.01~)も検討要素
  • SSJデータアーカイブ
    • 対象データ
      • 統計法でカバーされない,民間/政府寄託の調査データ
    • アーカイブのメリット
      • 長期保存(データを散在させない)
      • メタデータ管理(調査データの活用促進)
      • フィードバック(利用状況の把握と新規研究テーマの発見)
    • 仕組み
      • SSJDA(Social Science Japan Data Archive)が窓口
      • 各研究機関からデータを寄託してもらい,SSJDAが整形保存,利用者の申請に応じてネット提供.2次利用の結果(論文等)は寄託者にフィードバックする
    • データの受け入れ
      • フォーマットは様々だが,SPSS等で利用できるように変換保存する
      • 個人情報は秘匿処理を行う
  • 海外との比較
    • 欧州ではこの手のDBは作りが同じで,横断利用が容易にできる
    • 海外のDBは利用料は高いが,大きな組織単位で加盟するので研究者負担は少ない
    • 海外にはデータ整理を専門とするデータライブラリアンがいる
  • 運営上の課題
    • データ整理の専門職不足
    • 予算が足りない
    • アーカイブデータは寄託者の善意で成り立っている(提供が少ない)

2. 自然科学の研究記録のアーカイブ
  • 自然科学系の研究記録について,定義・発生・利用等を網羅的に解説
  • 研究記録の定義
    • 社会的意義や思考の記録といったことも言っておられましたが,一番はやはり「実験・観測データ」?
  • 研究記録はどんなところで発生するか
    • 研究の現場:準備活動時・研究実施時・研究の総括/評価時
    • 機関と個人:機関の公的記録・プライベートなメモ 等
  • 利用
    • 記録が参照されるのは検証時
      • 科学の発達過程の検証
      • 組織や制度の正当性の検証 等
  • 問題点
    • アナログとデジタルの実験・観測データはそれぞれアーカイブ手法が異なる
    • 実験・観測データアーカイブから検証可能な状態に持っていく環境の整備が不十分
  • アーカイブの重要性
    • 大規模な実験を必要とする自然科学では,実験条件が複雑なため背景やデータ処理手法が詳細にわからないと追試しづらい.それを明確に示す過程アーカイブは必要

3. 旧史料館レコーズの整理と公開について
  • 早めにオリオン書房に行きたかったので,ご講演が始まる前の休み時間に失礼しちゃいました.なので,メモはなしです(^^;
  • 頂いた資料によると,「旧史料館レコーズ」と呼ばれる,国文学研究資料館附置史料館の文書記録の目録化と公開の経緯についてご講演があったようです.

考察
さて,今回は後半サボってしまったので,簡単に.

今回,3件中2件のお話を聞くことができました.研究プロセスも含めたアーカイブは,前向きに捉えれば至極当然・今後の2次利用を考えると重要なことかと思います.その反面,アーカイブ作業に時間やお金がかかるというのは本末転倒だと思います.

もちろんアーカイブ研究者にとってはアーカイブするという行為そのものが研究対象ですが,それ以外の専門家にとって,過程のアーカイブ作業はあくまで小コストでベストな効果が挙げられなければならない.これは別に研究に限ったではなく,仕事をしている人も,勉強をしている人も皆が考えることです.昨今lifehack等が取り上げられるのも根底にはそのような考えがあることは否めないでしょう.

そう考えると,過程アーカイブとは,いかに気にせずに大量の作業内容がアーカイブされ,かつ利用可能な状態に整理されるかを追及することがミソになるのだと思います.Lifelog研究やWebアーカイブ研究等,大量データから意味のあるデータを汲み取って整理する研究分野を Watch していくことも重要なのでしょうね.

戦後の記録映画を残せ

記録映画保存センターのブログで紹介されていましたが,2/21(土)のNHKおはよう日本で記録映画の保存について小特集がありました.

7:35から10分程度だったわけですが,土曜日の朝早くに起きられるわけもなく(!?),録画しておいたものをゆっくり見させて頂きました^^

以下,簡単なメモです.

記録映画とは
当時の世相を伝える貴重なもの.例えば,以下等.
  • 佐久間ダム総集編(1958) → 戦後の経済復興を伝える
  • 水俣 ~患者さんとその世界(1971) → 公害の姿を伝える
現状
横浜のフィルム現像会社を例に,記録映画保存の現状が紹介されました.フィルム現像会社では,映画制作会社のフィルム原版を保管しています.しかし,管理のためのスポンサーが付かず,現状原版は放置されている場合が多いようです.このような放置原版は国内に約5万本,うち30%は記録映画だとされています.

問題点
基本的に放置なので,フィルムの保存状態が悪く,劣化する例が多く見受けられるそうです.例えば,高温・高湿度のためフィルムにシワが寄ってしまったり,フィルム同士がくっついて塊のようになってしまう場合があります.

これらの問題に対し,現像会社でも何らかの手を打ちたいところだそうですが,所有者の許可なく修復保存・廃棄・もちろん二次利用もダメで,対策が打てないのだそうです.

取り組み
そこで,国立近代美術館フィルムセンター 相模原分館では,後世に伝える貴重な記録映画の収集を行うため,所有者の確定と同意を取る作業を続けています.フィルムセンターでは,気温5度,湿度40%を保ち,フィルムが500年は耐えうる保存環境が整っているそうです.

また,記録映画保存センターの村山英世氏が中心となり,記録映画アーカイブプロジェクトも立ち上がっています.氏曰く,このプロジェクトは個人やプロダクションが保管管理する記録映画を公共・国民のものにするためのプロジェクトだそうで,まず第一弾として,日立製作所が持つ「岩波映画製作所」フィルム原版群のアーカイブプロジェクトが企画されています.岩波映画製作所は平成10年に倒産しましたが,これまでに4000本・1億フレームにのぼる映画が残されています.代表的なものには,「雪の結晶(1953)」,「教室の子供たち(1954)」等があります.

センターでは,これらのフィルムから所有者を探し出し,寄贈依頼を行うという地道な活動を続けており,これまでに80%程度は寄贈に同意を得られたそうです.

村山氏は,最終的にはアメリカの「映画保存法」のような仕組みを作らないと解決できないと考えています.持ち主が現れない場合は国に寄贈するという仕組みが作られれば,現像会社で朽ち果てるのをただ待つだけのフィルムが蘇るのかもしれません.

プロジェクトには,映画監督の羽仁進氏も参加されたようで,「フィルムにはその時代でないと記されないものがある.そのため記録映画の見直しには意味がある」旨,語られていました.

活用の取り組み
フィルム・アーカイブはフィルムを保存するのみならず,それを活用する環境ができて初めてフィルム・アーカイブと呼べます.番組では,以下の2つの事例を通して活用に向けた取り組みが紹介されていました.
  • 台東区忍岡中での理科授業
    • 理科の授業で50年前の科学映画を活用.映画自体の質がいいので効果的.科学法則は原則変わらないので古くても使える.
  • デイサービス施設での記録映画上映
    • 高齢者に古い記録映画を上映し,古い映像を通して思い出を語り合ってもらう.
    • 記憶を呼び覚ましてもらうことで認知症予防等に活用.
所感
短い特集でしたが,さすがNHK,内容がまとまっており現状の問題点と取り組みがよくわかりました.ryojin3的にはフィルムをアーカイブするうえで欠かせない(はずの)デジタル処理についても紹介があると面白かったのになぁという感想です.また,NHKでは川口で大々的にアーカイブの取り組みをやられているので,そことの関係や連携(あるのかな)等も知りたかったところです.

Europeana徹底解剖

昨年末,公開と同時にアクセス過多で一旦サービスを停止するという事態に陥った欧州デジタル図書館「Europeana」.サービスが再開して2ヶ月近くが経ちました.そろそろシステム的にも利用状況も安定してきたのではないかと思い,ちょっといろいろ調べてみました.今回はそのまとめです.

■経緯
以下は,Current Awareness PortalITMediaCNET Japanから拾って時系列に並べたニュース記事です.網羅的に集めたつもりですが,検索漏れがあるやもしれません^^

2005年
2006年2007年2008年
■協力組織
2009.02.15現在,108機関.まぁこう見ると意外と少なく感じますが,国の代表(National representatives)には各国を代表する図書館等が名を連ねています.
  • Archives 12件
  • Audio-visual collections 7件
  • Cross-domain associations 12件
  • Libraries 14件
  • Museums 11件
  • National representatives 26件
  • Other 2件
  • Project Contributors 12件
  • Research institutions 12件

■言語

ヨーロッパ中心の25ヶ国語にI18Nされています.
  • Catalan
  • Bulgarian (bul)
  • Czech (cze/cse)
  • Danish (dan)
  • Dutch (dut)
  • English (eng)
  • Estonian (est)
  • Finnish (fin)
  • French (fre)
  • German (deu)
  • Greek (ell/gre)
  • Hungarian (hun)
  • Icelandic (ice)
  • Irish (gle)
  • Italian (ita)
  • Latvian (lav)
  • Lithuanian (lit)
  • Norwegian (nor)
  • Polish (pol)
  • Portuguese (por)
  • Romanian (rom)
  • Slovak (slo)
  • Slovenian (slv)
  • Spanish (esp)
  • Swedish (sve/swe)

■機能

  • 検索
検索窓1つのGoogle方式.Advanced searchを選択すると,(「Any fields」,「Title」,「Creator」,「Date」,「Subject」)×3を(AND/OR)で検索できます.
  • My Europeana
登録ユーザの検索結果の保存,タグ付与,友達への紹介,等ができるらしいが,まだ登録も利用もできないようです.
こちらもデモがあるのみ.コンテンツの共有や再利用についてのアイデアを議論する場としてCommunitiesが用意されるようです.デモを見てみると,SNSのような運用を想定しているようです.
下側に作品の多さに比例して大きさの異なる西暦が並び,各西暦をクリックすると上側に作品が出てきます.上側に出てくる作品は横スクロールバーの動きに合わせてブワーっとフローして行きます.iPhoneのマルチタッチに近い動きか.驚いたのは,普通こういうのってFlashで作ると思うんだけど,全部JavaScript!なんとも….まだまだベータ版らしく,左側の検索窓から西暦を入れて検索すると,検索結果の西暦は大きさが変わらなかったりしますが,まぁご愛嬌.
実験的ラボ.大学や研究機関,コンテンツプロバイダと協力し,Europeanaの持つコンテンツを素材に実験的な機能を試していこうというラボです.今のところ,プロトタイプのSemantic Searchが公開されています.MultimediaN N9C Eculture projectThe ClioPatria semantic search web-serverで動いているようです.これについてはEuropeanaのSemantic Searchのインターフェースも含め,別にもっと詳しく調べたいと思っています.

■コンテンツ

  • 概要
Europeanaは検索の窓口です.検索結果のサムネイルはEuropeanaのイメージサーバにキャッシュされているようですが,コンテンツ本体は参加機関のサーバから再生されます.従って,全てのコンテンツに関するコントロールと権利保持は各参加機関で行うことができます.
  • 資料件数
約200万件
  • フォーマット
フィルム,写真,絵画,音楽,地図,原稿,書籍,新聞,etc.
  • 将来的な話
2010年までに現在の200万点から,1000万点アイテムの完全公開を目指すそうです.そのため,実際にEUはデジタル化資金を拠出しています(Current Awareness Portal,2008.12.04).また,今はコンテンツの登録を文化組織に限定していますが,将来的には個人の所蔵等も登録公開できるような仕組みを作って,コンテンツの幅を持たせたいようです(INTERNET Watch,2008.11.21).

■相互運用性
詳細はEuropeana/EDLnet conference: Users expect the interoperableにあります.


■メタデータ

基本的にはQDC(The Qualified Dublin Core)のようですが,一部拡張もされています.詳細な仕様はMetadata elements in the Europeana prototype(pdf)にあります.

拡張エレメント
  • <dc:relation>のサブプロパティとして<europeana:isshownby>
  • <dc:relation>のサブプロパティとして<europeana:isshownat>
  • <europeana:usertag>

■閲覧

せっかくなので実際に有名なコンテンツを見てみました

いやぁ,全然徹底解剖してないけど,疲れちゃった.今日はこれくらいで.次は今回息切れが著しい相互運用性やメタデータ,セマンティック関連を中心に調べたいと思っています.てか,むしろそっちが専門に近いだろうに….

近代化産業遺産とアノテーション

地域コミュニティサイト「Lococom」"近代化産業遺産"特集サイトができたようです.
近代化産業遺産とは,経済産業省が認定する文化遺産群のことで,日本の産業近代化に貢献した建物や機器類の保存活用を目的としています.2007年度には,地域史・産業史を軸とした33のストーリーとそれに関連する575件の産業遺産が認定されています.
今回は経産省の「地域経済産業活性化対策調査」事業の一環で,Lococomを運営する株式会社ネクストが受託開発を行ったようです.そこでは,以下のような効果が期待されています.
  • コンテンツ掲載による,広範囲な近代化産業遺産の認知
  • 地元からの情報発信とクチコミ化による地域の活性化
現在は検証フェーズのようで,情報提供やクチコミを行うことの有効性・ビジネスモデルについて検討が行われているようです.

また,サイトにはモデル地域の特集ページも用意されています.群馬県桐生市をモデルに,近代化産業遺産コンテンツの提供のほか,商工会議所等と連携した観光情報(宿泊,飲食,施設,イベント情報等)が提供されています.

経産省のサイトから産業遺産のリストを入手できますが,せっかくなのでLococomの特集ページを使ってどのような遺産があるのか見てみたいと思います.特集ページではLococomが持つ機能(遺産の検索・閲覧・クチコミ投稿・クチコミ閲覧等)がそのまま使えるようになっています.

主な近代化産業遺産(順不同,ryojin3の興味順)
経産省では2008年度も引き続き前年度と異なる分野で「近代化産業遺産群 続33」として認定を行っており,こちらもLococomで公開予定だそうです.また,ネクストの受託は2009年3月末までですが,コンテンツは4月以降も掲載するそうです.これら一連の動きは,経済産業省 経済産業政策局の活用委員会の議事(ページの一番下)を参照することで詳細情報が得られます.

さて.このような事例は,文化遺産情報にアノテーションを活用する好例なのではないでしょうか.

あるデータに対し,注釈データ(メタデータ)を付与することをアノテーションと言います.Java使いならご存知,クラスやメソッドに入れる,アレです.エラーチェックや加工はしませんし,「注釈」は定義が広いので一概には言えませんが,遺産情報(あるデータ)に対するクチコミ(注釈データ)はアノテーションの一種と考えられます.

アノテーションについては様々な研究が行われているようです.以下はざっと調べた一部分です.他にもたくさんやられてそうです.

消費者生成メディア,いわゆるCGMが取り入れられているeコマースサイトでは,アノテーション,つまりクチコミは商品情報同様にサイトの中心的なデータになりつつあるようです.

クチコミは売りたい側の意図を反映しない純粋な消費者の声であり,確度の高いマーケティング情報源としてここ数年その収集方法や解析方法を中心に注目を集めています.

遺産情報に対するクチコミは,eコマースサイトにおけるクチコミのように直接商品にフィードバックがかかる類のものではありませんが,それなりに重要な意味を持つかと思います.なぜなら,クチコミは観光情報として活用できるからです.

観光情報として活用が見込まれるということは,平たく言えば地域の経済活性化につながる呼び水になりうる,ということを意味します.恐らく用意されているシナリオは(こんなに単純ではないでしょうが),サイトに地元情報を発信→サイト閲覧による観光客の獲得→観光客のクチコミ書き込み→クチコミ情報を閲覧した更なる観光客の獲得,,,のような感じでしょうか.

実際には,サイト自体の周知(SEO,宣伝/広告),クチコミを増やす方策(その遺産のぬしとなるような人を(お金を払って)サイト側で育てる等),地域情報のこまめなアップデート,他の類似サイト(旅行サイトや地図サイト)との差別化,等など,考えなければならない点が山ほどあるでしょう.

また,集計やマイニングのことも考え,クチコミをGDAのようなXML形式のアノテーションで集めておくことも大事かと思います.クチコミからの知識発見にはXMLのようなデータ表現は役立ちそうです.

最後に.どうでもいいことですが,このサービスで残念なのは遺産のページから貼られている「公式ページ」へのリンク.これ,順次入れ替えて行くんだろうけど,今のところどの遺産を見ても経産省のページにリンクが貼られています…orz

Google Earth

新しく入れたGoogle Earthが楽しくて,いろいろいじっていました.

先日のプラド美術館は KML + Google SketchUp + αで作られているようです.

Google Earthはリリースされて時間が経っていますので既にご存知の方も多いでしょうが,ちょっと説明.

KML(Keyhole Markup Language)とは,Google EarthやGoogleマップ上に地理的な情報(目印とか,地名とか)を配置するためのXMLボキャブラリのことです.2008年にはOpenGIS KML Encoding Standardとして,OGC(Open Geospatial Consortium)標準となっています.

また,Google SketchUpとは3Dモデリングシステムのことです.SketchUpには利用可能なデータ形式にKMLやKMZ(KMLを圧縮した形式)があり,写真からモデルを起こす機能もありますので,恐らく,プラドは写真をSketchUpで3Dに起こし,KML化してGoogle Earthに登録しているのでしょう.

+αと書いたのは,Earth上のプラド美術館モデルには,画像一覧が出てきたり,画像の詳細が閲覧できる部分があることを指しています.ここはどうやって作っているのかわかりませんが,スクリプト言語とKMLの画像指定(href,NetworkLink等),SketchUpの写真貼り込み機能あたりを組み合わせて作ってるんでしょうかね.

せっかくなので,プラドをブラウザに埋め込んでみました.表示するにはブラウザ用プラグインが必要です.

Google earthでプラド美術館

Google Earthでスペイン・プラド美術館の超高解像度写真が閲覧できるレイヤーが出ました.

主なリソース


今まで使っていたマシンは非力でGoogle Earthがうまく動かなかったので保留してたのですが,そこそこハイスペックなマシンを手に入れたので,早速試してみました.

まずはGoogle Earthをインストール.最近はGoogle Updaterという統合管理ツール?でGoogle関係のソフトは管理されてるんですね.残念ながら,自分の環境ではUpdaterがうまく動かず,個別にDLしましたが….

まずは左下の「レイヤ」の「建物の3D表示」にチェックを入れ,ジャンプで「プラド美術館」を検索します.



お,プラド美術館のところがセカンドライフチックになってます.少しずらして見てみます.



プラド美術館上でクリックすると,一瞬建物が青くなって,Masterpieces(画像一覧)が出てきました.現在は全部で14点が掲載されているようです.



せっかくなので「三美神(The Three Graces)」を選択.画像とメタデータが表示されました.解説文も付いており,下側「Continue reading」から詳細な解説を読むこともできます.



メタデータはこんな感じ.

 Author: Rubens, Peter Paul
 Catalog n. P01670
 Technique / Support: Oil / Wooden Panel
 Dimensions: H. 221 CM W. 181 CM
 Date: Ca. 1635
 Subject: Mythology. Gods
 Provenance: Royal Collection
 School: Flemish
 Object type: Painting
 Displayed in: Villanueva Building - Room 9 (On Show)

邪魔なのでサイドバーを消してから更に細かく見てみます.よく見ると,画像の下に「Browse this picture in ultra high resolution (the world largest pictures)」というリンクがあります.the world largest picture ですか.スゴイ.14G pixelらしいです.

で,これを選択すると,ググっと画面が動き,建物内部に入っていきます.そこでは背景が深い青になり,画像のみが表示されます.右上にマウスポインタを動かすと,写真を拡大縮小できる操作メニューが現れます.



操作メニューでは,画像全体のどこをフォーカスしているのかがわかりつつもどんどん拡大や縮小ができます.写真は拡大してみたところ.まだまだいけそうなので,最大限拡大してみました.



MAX拡大.右側の女性の髪の毛あたりです.さすがにMAXにするとボンヤリしていますが,絵画のひび割れ等細部を見ることができました.



画像を堪能したので,右上の「写真を終了」ボタンで美術館を抜けます.



え...ここに飛ばされるのか...どうせなら画像一覧に戻ればいいのに.ここからまた画像一覧に戻るのが面倒です.ま,これはryojin3がGoogle Earthの操作に慣れていないせいもあるだろうケド...



ここらへんまで引いて,建物か「MUSEO NACIONAL DEL PRADO」と書いてある白いアイコンをクリックすれば
再び画像一覧に行くことができます.

と,まぁここまでが一連の閲覧手順です.

以下,ryojin3の所感です.

今回の試みはどういう意図があったのでしょうか.プラド美術館の場合,2つの特徴が見受けられます.つまり,1) 超高精細画像の公開,2) ユーザアクセスが簡便なプラットフォームの活用,です.

前者は14G pixelと桁違いに大きな画像をよりセキュア(Google Earthがセキュアであるかどうかは本質的な議論ではありませんが,少なくともWebにポンと出すよりかはセキュアであると考えられます)な環境で見せている点が特徴的です.もちろん用途として閲覧のみならず美術研究の促進も考えられます.また,後者に関してはそのようなコンテンツをただ自館のサイトにアップするだけでなく,Google Earthというそれなりに人が利用しているプラットフォームを用いることでニュース性や露出度の高さ,Google Earthの持つ機能を利用できる点が特徴的です.

現状,プラド美術館の外装は昔のウォークスルー型仮想美術館のようですし,操作もそれなりに面倒です.しかし,絵画コンテンツの増加と操作性やユーザインターフェースが向上すれば,美術研究のみならず,教育用コンテンツとしてどんどん活用されていく気がしますし,プラド×Googleもそれを狙っているのではないでしょうか.

今回試した環境はたまたまリリース直後のGoogle Earth 5.0 betaでした.海中や火星の探索,タイムスライダーによる過去の画像閲覧が可能になっているバージョンです.このようなコンテンツと機能の充実ぶりに,ryojin3は,美術作品のみならず,自然科学,歴史学,その他様々な教育用コンテンツは地理情報やタイムラインと紐付きながらGoogle Earthに集約されていき,教育用プラットフォームとして活用されていく可能性を感じました.