Memory Maker



オークランド戦争記念博物館は,1852年に開館したニュージーランドの国立博物館で,戦争関係以外にも,歴史・自然史系のコレクションを持つニュージーランドの主要な博物館だそうです.

先日,この博物館が中心となり面白いCGC(Consumer Generated Contentって言葉あるのかな)サービスが公開されました.
ネタ元はCurrent Awareness(2008.11.17)です.
このサービスは,National Digital Forum(ニュージーランドの図書館・博物館・文書館の連合体)のプロジェクト「DigitalNZ」の一環であり,第1次世界大戦の休戦協定成立から90周年を迎える記念として公開されたようです.

仕組みは以下のようになっています.
  1. まずNational Digital Forumを構成する130を超える機関が大戦中の兵士の画像や音声映像等をコンテンツとして提供します
  2. ユーザはこのコンテンツ群を自由に組み合わせてFlashビデオ作品を作成し,Memory Makerサイトに投稿します.
  3. ユーザは投稿作品を TOP VIDEOS/LATEST VIDEOS という形で閲覧でき,
  4. 更にURL,Embed URL,Emailを通して共有することができます.
コンテンツの作成は非常に容易で,コンテンツ種別やエフェクト毎にタブ分けされたプレビュー画面から,タイムライン上(コンテンツ別にタイトル・ビデオ・オーディオ・音楽がある)にコンテンツをドラッグ&ドロップして組み合わせていくだけで最高1分の作品が作れます.

表 コンテンツの種別と数
フォーマット/エフェクトコンテンツ数
Video(映像)10
Audio(音声)13
Transitions(エフェクト)6
Titles(タイトル)21
Graphics(画像)計156
Music(音楽)20

DigitalNZ」ではMemory Maker以外にも,ユーザが作った各種ウィジットや開発者向けAPI,コンテンツ提供者向け情報を公開しており,2.0な世界を意識した作りになっています.

博物館を中心とするコンテンツホルダーがコンテンツを提供し,サイトはその利用環境(コンテンツ・API・各種ウィジット等)を提供する.ユーザはその環境下で複合的にコンテンツを利用する.利用するのみならず,自作のソフトウェアや他所のAPIと組み合わせてMash upしても良い.

このような試みは高く評価できると思います.日本国内にも歴史的・芸術的に見て価値のある様々な博物館系コンテンツがデジタルアーカイブという名の下で公開されつつあります.しかし,ユーザはその世界で検索と閲覧のみが許され,例えば教育用コンテンツの作成や芸術コンテンツの創作といった2次的な利用やその方法についてはあまり考慮がなされていない気がします.

ニュージーランドでは国が先導して取り組んでいるので予算が付くし,コンテンツの質も保証されているというアドバンテージがあると思いますが,コンテンツの利用という点では,このような試みは今後の新しいデジタルアーカイブを考える上で非常に参考になるのではないでしょうか.

アート・ドキュメンテーション学会 第1回 秋季研究発表会

2008年12月6日(土),アート・ドキュメンテーション学会主催の第1回秋季研究発表会に参加してきました.会場は印刷博物館.参加者には印刷博物館で開催されている企画展「ミリオンセラー誕生へ! 明治・大正の雑誌メディア」および総合展示ゾーン,VRシアター等の見学もできるチケット付きでオトクでした.

※レポはryojin3の所感であり,講演者の意見・意図が100%反映されているとは限りません!その点ご注意くださいませ.

基本情報
  • 日時:2008年12月6日(土)10:30 - 17:00
  • URL:http://www.jads.org/news/2008/1206.html
  • 参加者:100名弱?ちょっと自信なし
  • 参加者に対して会場がややせまい.3人がけの長いすに3人座る感じ

プログラム(敬称略)
  • 戦後新聞社主催展覧会資料の調査および収集の展望
    • 国立新美術館、日本美術情報センター 橘川英規
  • 文字を残すための序論的考察
    • 立命館大学グローバルCOE客員研究員 當山日出夫
  • 東京国立博物館の収蔵品管理システム
    • 東京国立博物館学芸企画部博物館情報課 村田良二
  • ファンドレイジングとドキュメンテーション
    • 東京都写真美術館 末吉哲郎
  • 版木資料のデジタル・アーカイブについて
    • 日本学術振興会特別研究員DC1/立命館大学アート・リサーチセンター 金子貴昭
  • 博物館図書室の業務と既存次世代図書館システムの機能
    • 総合研究大学院大学複合科学研究科情報学専攻 矢代寿寛
  • 英国V&A博物館とスコットランド国立博物館所蔵浮世絵のデジタルアーカイブ
    • 立命館大学アート・リサーチセンター 赤間 亮
概要
  • アート・ドキュメンテーション学会は博物館・図書館の資料管理部門(データベース利用やメタデータ作成)の人たちが主な聴衆
  • これまで学会では年1回2日間の年次大会を開いてきたが,発表件数が増えてきたので今回初めて研究会を開いたようだ
  • 最後のほうで幹事の方がおっしゃっていたが,研究会を開くに際して,まだ統一的な土台(基礎的な情報の共有)が薄く,発表の内容が研究よりもその背景説明に終始してしまう傾向が見られたようだ

各発表メモ

戦後新聞社主催展覧会資料の調査および収集の展望
  • 会場に到着した頃には終わりかけ・・・ここに書くほど理解できていませんので,割愛します
文字を残すための序論的考察
  • デジタルアーカイブをするなら,異体字の取扱いにも注意しようという話
  • 異体字を含むメタデータの検索では適合率が下がる
    • 表記揺れの吸収
    • シソーラスの整備
  • アーカイブ時の「文字同一性」が重要
  • JIS改訂に併せて,図書館では古いJIS本が廃棄される(!)
  • デジタルアーカイブの問題
    • ベンダ依存の文字コードの取扱いの難しさ
    • CD/DVD/HDD 等のメディア保存問題
  • 会場からの質問
    • PDF/Aと日本の現状の違い,特に制作の標準化について
      • ryojin3 は PDF/A をよく知らないので,あとで調べる
      • ISO化はされているらしい
    • 外国の古代文字アーカイブ
      • フォントデータ(もしくは画像)+コードポイント
      • 古代文字アーカイブってどう管理してるのかな
    • Google bookの動向
      • これも気になる.あとで調べる
  • 会場からのコメント
    • 歴史的文献研究では,研究の本質ではない部分で,意外と表記の揺れや古い表記等が気にならない場合がある
東京国立博物館の収蔵品管理システム
  • 情報処理学会第68回デジタルドキュメント研究会での発表を,今回の聴衆向けにModifyした感じ
  • 博物館では,中の人で設計・実装できる人は相当貴重.発表後もいたるところで質問されていた
  • 会場からの質問
    • MDA SPECTRUMとの違いは?
      • 東博独自のワークフローを分析してスクラッチから作っているのでSPECTRUMは参考程度
    • システムへの入力規則みたいなものはある?
      • 今後.揺れを吸収していく方向
ファンドレイジングとドキュメンテーション
  • 美術館・博物館での資金集めの話
  • 発表者はWBSにも出たことがあるらしい.なんとなくその時テレビ見てた気がする
  • 資金を出す企業のメリット
    • PR,CSR,社会教育の場として利用
  • 維持会員のメリット
    • 特別展のオープニングセレモニーに呼ばれたり → 顔つなぎで結構大事らしい
    • バックヤードを見れたり,あといろいろ
  • 資金の使い道
    • 作品・資料購入-- 国際交流(シンポジウム開催等)
    • 企画展運営費,あといろいろ
  • 評価
    • 日経の実力調査で評価されている
  • ryojin3の感想
    • もっとキチンとした対外評価基準はないのだろうか
    • ファンド集めとドキュメンテーションの関係がよくわからなかった
版木資料のデジタル・アーカイブについて
  • 版木資料は英語で「Japanese Wood Block」
  • 版木のデジタル化手法のアレコレを紹介
    • ライティング手法
    • カメラ選定
    • カメラ配置手法
    • 被写体配置手法
  • デジタル版木DBのアレコレを紹介
    • 主にメタデータの設計が中心
    • 版木を「柱台」中心にグルーピング?した設計
    • アクセス権限の話
  • 会場からの質問
    • DRMは?
      • 今のところ特にない
    • メタデータにある論文参照はどうやってやるの?
      • 論文へのリンクはNoteという項目からReferできる
博物館図書室の業務と既存次世代図書館システムの機能
  • スライドが黄色い! プロジェクタの出力ミス?
  • 博物館図書室
    • 専門図書館の一種
    • 専門図書館の定義(ALA図書館情報学辞典より)
      • 組織の目標を追求する上で、そのメンバーやスタッフの情報要求を満たすため、営利企業、私法人、協会、政府機関、あるいはその他の特殊利益集団もしくは機関が設立し維持し運営する図書館。コレクションとサービスの範囲は、上部もしくは親機関の関心のある主題に限定される。
  • 次世代図書館システム
    • 次世代ILSと次世代OPACに分類できる
      • 次世代ILS
        • Integrated Library Systemの進化版?
        • Intelligence Library Systemの進化版?
        • どっちなんだろ
      • 次世代OPAC
        • OPAC(Online Public Access Catalog,オンライン蔵書目録)の進化版?
        • ソーシャルタグ付け・外部API利用・コメントやレビューができる機能を有するあたりから来る
  • 次世代図書館システムの機能
    • 検索
      • 検索側:統合,横断,キーワード入力支援,ファセット,タグ,内容目次
      • 結果側:パーマリンク,ブックマーク,ソート・絞込み,拡張的書誌情報表示,検索結果・書誌エクスポート
    • 利用者参加
      • ソーシャルタギング,コメント,レイティング,レビュー
    • その他
      • 新着資料等RSS配信,資料推薦
    • 会場からのコメント
      • 博物館図書室は書籍とモノをつなぐ重要な部分.外向けよりも内部利用者に目を向けてあるべき姿を考えるべきだ
      • 背景説明に時間がかかり,本質部分の時間が短すぎた.これは研究背景の共有ができていない学会の現状を浮き彫りにするものかもしれない
英国V&A博物館とスコットランド国立博物館所蔵浮世絵のデジタルアーカイブ
  • 立命館大が行った海外博物館のデジタルアーカイブ紹介
    • ヴィクトリア・アルバート博物館:浮世絵,38000枚
    • スコットランド国立博物館:浮世絵,4700枚
  • アーカイブ化をしてわかったこと
    • 泣き別れになっていた続き物の作品が見つかった
    • 同じだと思われていた印刷文字の違いが見つかった
  • 今後
    • 誰がどれを作ったのか,真贋判定も含めて調査研究が必要
所感
  • 博物館とか図書館で,資料を扱うための様々な要件が様々な方面の人たちから発表された,という印象
  • 最後の講評で,学会の会長が言っていたが,「これらの研究発表の上位概念として,メタレベルの「何か」がある」いうことは実感できたかもしれない
  • 以下のような分類.大きく分けると,アーカイブと中の人調査/対応
    • アーカイブ:戦後新聞,文字,版木,浮世絵
    • 中の人調査/対応:東博システム,ファンド,博物館図書室

MLAの連携「デジタルへの実践と課題」

2008年11月18日(火),DAF(Digital Archive Forum)主催で行われたMLAの連携「デジタルへの実践と課題」に参加してきました.今回も会場は慶應大でした.前回のシンポジウムといい,最近慶應に行く機会が多いです.

基本情報
  • 日時:2008年11月18日(火)
  • URL:http://daf.lib.keio.ac.jp/index.php/jpn/News/node_343
  • 参加者:50名×4列=200人くらい収容の部屋で,100人くらいいる?
  • リアルタイムにネットで映像配信をしていたようだ
  • 資料は後でネットにアップされるらしい
プログラム(敬称略)
概要
  • MLA(Museum,Library,Archives)連携のワークショップ
  • 過去2年ワークショップを開催している
  • 2006年:インターネット時代にMLAが連携することに意義があることを確認
  • 2007年:多様な連携の可能性と問題の提起.併せてDAF(Digital Archive Forum)の設立を提案
  • 2008年:紙のデジタル化に焦点を当て,取り組み・現状報告と課題の議論
    • デジタル資料の公開に伴う著作権問題
    • デジタルデータの長期保存
    • デジタルデータの流通,技術,組織,コスト等の諸問題
各発表メモ

デジタル・ネット時代の大学図書館:慶應義塾のデジタル化事業
  • 慶應の杉山先生が講演
  • 図書館の向かうべき姿
    • 特徴的なコレクション(日本固有のもの,アジア固有のもの)のデジタル化と可視化を行う
      • デジタル化:特徴的な資料のデジタル化
      • 可視化:デジタル化したコンテンツを見せるためのソフトウェア?
    • これらを英語で発信することが大事
Digitization among MLA - Emerging examples and challenges
  • OCLCのJames Michalko氏が講演
  • 昨年のシンポジウムで言ったことを振り返る形式
  • 特殊コレクションのデジタル化はやるべき
  • Collective Collectionという概念
    • 皆がWebを使う世界では,ユーザは様々なタイプのコンテンツを求めている
  • コラボレーションの重要性
    • 特殊コレクションもコラボしなければ活きない
    • 技術,標準化,資金調達等も併せて重要
    • 最終形態はConvergence
      • MLA間で知恵を出し合い(Coordination),お金を出し合って共通のデジタルリポジトリを作る(Collaboration)
  • コラボレーションの実践
    • ワークショップでコラボを実践すべし
    • モデルの確立,部門間の連携強化,具体的な方策の議論を行うとよい
    • 実際,OCLC ではデジタル化・横断検索・メタデータ等,5 つのプロジェクトを実践している
    • 興味がある人は資料ダウンロードできるよ(多分下のリンク先)
国会図書館の資料デジタル化:課題と展望
日本におけるデジタル・アーカイブズの紹介:国立公文書館並びにアジア歴史資料センターの取組み
  • 元慶應,現国立公文書館の高山先生が講演
  • 話に落ち着きがあり,慣れてるなって感じた
  • 特殊コレクションとして「公文書」.そうくるよね
  • 公文書のデジタル化はトータルの20%程度か
    • 体制の強化を強調
  • デジタル化の内容
    • 目録情報+オリジナル紙のデジタル化
    • 目録に関しては,年度内に受け入れたものは年度内にデジタル化する
      • 目録デジタル化は 7000件/年
    • オリジナル紙のデジタル化はそのうちに
  • 目録データの検索精度
    • 資料の標準化のレベルが違うので,図書館のほうがレベルが高い
    • 図書館に追いつくのがいいことか,はまた別の問題
  • 外部連携
  • 標準化
    • 地方自治体が準拠可能なデジタルアーカイブシステムの標準仕様書は昨年完成?
      • ネットでは資料見つからず...
  • アジア歴史資料センター
    • シソーラスの整備が課題
      • 太平洋戦争→大東亜戦争,中国侵略→シナ侵略といった表記ゆれの吸収
  • 今後の課題
    • 30年原則に基づき,そろそろ入ってくるパッケージ系,ボーンデジタルの公文書の取扱い
  • Watchすべし
東京国立博物館における資料デジタル化
  • 東博初の情報系研究員,村田氏
  • 東博のデジタル化の現状説明
  • 文化財の写真は事ある毎に撮る
    • 展覧会,図録/目録作成,調査,特別観覧
  • 古典籍はまずマイクロフィルム化
  • 写真フィルムは 4x5 で 30万枚程度
  • 管理システム
  • 課題
    • 学芸員の選別を必要としないユーザニーズの抽出
    • RAWデータの取扱い
    • 研究員の個人撮影写真の利用方法
日本におけるアーカイブズ総合目録の構築
  • 国文学研究資料館EAD/XMLな五島氏.
  • 資料館が戸越銀座から立川に移ったらしい.
  • 全国アーカイブズ総合目録
    • ユニオンカタログという言い方
  • DACSに基づいてシステムを作ったらしい
慶應義塾大学メディアセンターにおけるデジタルへの取組み
  • 違うタイトルで講演.タイトル「紙とデジタル・・・(失念しました)」
  • 入江氏は今回のワークショップの仕掛け人
  • 出版社とユーザがダイレクトにつながることで起こる図書館の中抜き化を防ぐため,データ作成やシステム・保存において図書館の必要性をアピール?
出版コンテンツのデジタル化 現状と可能性
  • 日販の人
  • 電子書籍の現状と課題を語る
  • 内容は主にデジタルコンテンツ白書やケータイ白書等のデータか

ryojin3の考察

今回のシンポジウムは,短時間の割に様々なトピックが織り交ぜられており,非常に濃密であったと同時に,ややまとまりに欠ける感があったかと思います.後でゆっくり考えてみると,資料を扱う仕事をしているあらゆる方面の人達が「資料をデジタル化すること」の意義と問題点について意識を共有する場だったのかもしれません.

デジタル化された後のデータ利用についても考えさせられました.Michalko氏はConvergenceが重要であり,そのためには各機関が持つデータをCollaborationすべきだと言う.これはいろいろ工夫をすれば利用者側から見てインターフェースが統一されるという点で非常に有効です.しか し,そのために各機関がお金を出し合って協業するというのはお金以外に人的にも時間的にもコストがかかり現実味が薄れますし,国や自治体のような機関が中心になるとどうもトップダウンでシステムが組まれ,面白味というか,ワクワク感というか,そんなものがが薄れる気がします.

岐阜県の例にあったような,公開型の大型DBにハイパーリンクを貼ったり,あるいは,複数のDBのAPIを用いてデータを横断的に取得するような仕組み,つまり小さなところ(一般ユーザ?)から大きなところ(専門機関?)に働きかける仕組みのほうがしっくりくる気がするのです.大きなところはそういうことが可能な窓口を用意しておいてくれればよい.

紙をデジタル化する際のポイントの1つに,特徴的なコレクションの作成がありました.この形成方法もまた,小から大へのアプローチが可能なのではないかと思っています.コレクションという語は図書館関係の人がよく使う専門用語かと思いますが,ryojin3は「あるキーワードや定義に基づいて集められるコンテンツ群」と理解しています.専門家が専門知識に基づいてコレクションを作るのももちろん大事ですが,ここでもやはり小から大,一般ユーザのアイデアを専門家の知識が上手にサポートできる仕組みがあった方が面白いかもしれません.

例えばユーザが独自の視点で構築するUser Orientedなコレクションであったり,各コンテンツのメタデータ(+コメント等のアノテーション)を機械的に解析するMachine Orientedなコレクションであったり,CGC(Consumer Generated Content)を実現するシステムというのも面白いのではないでしょうか.ある公文書データと博物館収蔵品データ,歴史的な音声データ等を組み合わせて教材コンテンツを自作するとか,化学データと化学者データを組み合わせて模擬的な実験体感環境を作るとか,そういうことが実現できそうな気がします.

このようなコレクションは,これまでの専門家によるコレクションの形成方法と大きく異なるため,(コンテンツの組み合わせ方にはデザインセンスが必要であるものの)十分魅力的なコレクションになりうると思います.

もちろん,このようなシステムを実現するためには,大側,つまりデータ提供側のデータが整備されていくことが前提になります.

その意味で,データの整備についてもいろいろな苦労が見られて,まだまだ解決課題は多いなと思いました.シソーラス,オントロジ,メタデータあたりのセマンティクス処理が重要なキーになるのではないかと思います.

デジタル知の恒久的な保存と活用にむけて - デジタルジレンマへの挑戦

2008年10月24日(金),慶應大学DMC機構の国際シンポジウム「デジタル知の恒久的な保存と活用にむけて - デジタルジレンマへの挑戦」に参加してきました.このシンポジウムは,映画・図書館・美術館・アーカイブシステム・ストレージデバイスの専門家が講演を行い,「デジタル知」の永続的な保存と活用について議論するシンポジウムでした.

講演内容

上記を見ても分かるとおり,非常に盛りだくさんでした.時間の都合で,最後の鼎談は聞けませんでしたが,1)~6) まで,非常に楽しく拝聴させてもらいました.既に講演資料もアップロードされているようなので,ざっとまとめと所感を書いておきます.

講演 1)
AMPAS(The Academy of Motion Picture Arts and Sciences) がまとめた「The Digital Dilemma」という冊子の内容をまとめたもの.主にデジタル映画素材のアーカイブ化と アクセスに関する課題がまとめられている.ちなみに,会場では冊子の和訳本が配られた.今回が日本発らしい.ラッキー.
講演 2)
国会図書館の長尾先生の講演はいたって普通.国会図書館の紹介から始まり,増え続ける資料とその保存問題,デジタル化と著作権問題,WARP の話等々.
講演 3)
ケン・ディボドー氏は NARA のアーカイブプロジェクトの総責任者らしい.講演資料の最後から2枚目のスライド,Preservation toolsのグラフは興味深い.縦軸に固有性(特定→一般),横軸に技術(技術→方法→オブジェクト)を取り,様々なトピックを配置しているが,1つ1つが掘り下げるとそれだけで本が書けそう.
講演 4)
慶應大の青山先生はデジタルコンテンツの発展を3軸(Volume,Quality,Time)で表現しているのが興味深い.会場からも質問が出たが,Quality をどう評価するのか難しそうだ.また,近い将来ストレージの容量不足が起こることに言及している.いらない情報が多いのか,人間の活動において大量の情報が必要になってきたのか.難しいところ.
パネル 1) (各人の発表)
パネルは,各人がそれぞれデジタル知の永続的な保存と活用について思うところを述べて,それについてディスカッションする形式.
1 人目は Nii の安達先生.Nii がやってる電子ジャーナルの NII-ELS や CiNii を例に,電子図書館と絡めた話をしていた.深層 Web のアーカイブに言及していたのが興味深い.
2 人目は NHK ライツ・アーカイブセンターの長町さん.NHK の映像資料をどう使っていくかの話が中心.活用する素材として,地域映像とか,戦争等の歴史映像,視聴者が撮った映像の二次利用等.映像は権利処理が大変だと認識しているようで,DRM の重要性を話していた.
3人目は慶應大の小野先生.元 NTT で 4K の研究をされていたとか.ユニバーサルアーカイブっていい響きだなぁ.内容はデジタルアーカイブを概観(作成→管理保存→利用)し,アーカイブデータのライフサイクルについてザッと述べていた.デジタル化のところですごいカメラ写真が続出してた.
パネル 1) (討論)
デジタル知の「時間的な持続可能性」について以下の議論が行われた.
  • 電子ジャーナルで昔に撮った解像度の低いデータをどうするか
    • →ある程度技術でカバーできる(!?)
  • 電子ジャーナルの管理用メタデータをどうするか
    • → XML がメインストリーム
  • 映像や音声など,いわゆるマルチメディアをどう取り扱うか
    • → 商業ベースでは既に行われているので,その手法の永続化がテーマ.
    • NHK の場合,映像は国民の財産だから永久保存は大前提.
    • ニュース映像等,鮮度が必要なものはファイルレス・テープレスのハイアクセシビリティが求められる.
  • NHK ではデータだけでは不安なのでフィルムの管理も徹底している.
  • デジタル写真の証拠性は?
    • → 1) GPS と絡めた透かし技術,2) 標準化というアプローチがある.
  • コンテンツの Quality の表現能力は技術的に見てどうか?
    • →時間がかかるが,近い将来(5~10年?)規格に沿った器材が登場し,Quality の表現能力が確保されるだろう
パネル 2) (各人の発表)
パネル 2) も 1) 同様,各人が簡単に発表し,後半議論,する予定だったが,各人が発表をした時点でタイムアウトだった.
1 人目の Pacific Interface の Herr 氏.コンサルだとか.NDIPP,NARAの取り組み,NSF の DataNet の紹介等.
2 人目はビフレステックの井橋氏.元 SONY の人で,光ディスクの標準化が専門.様々な光ディスクの標準について,歴史や規格の意図,最近の動向等を話されていた.今年の夏に NPO 法人アーカイヴディスクテストセンターを作り,ディスクの信頼性評価を行っているようだ.
3 人目は京大の越智先生.非常に面白かった.「密封半導体メモリ」というものを考えており,データが書き込まれた半導体メモリを密封することでそのまま長期保存に活かせないかという話.シリコンと二酸化シリコン(SiO2)で半導体デバイスを構成し,それをガラスで密封してしまうというやり方.メモリチップに物理的な接触がないので,かなり長期間使えるらしい.
4 人目は情報ストレージ研究推進機構の押木氏.ハードディスクの構造と,RAID についてわかりやすく解説をしていた.
その他
  • 鼎談は帰ったので聞けてません...
  • ケン・ディボドー氏(NARAの人)はテレビ講演だった.録画でなく,HDTV をネットワークでつないだものらしい.
  • 机がないので,メモが取りづらかった
  • この日は大雨.靴がぐっちょりしてしまった
  • 休憩時間に水が配られた.リッチ!
  • 専属?のカメラマンがいたのだが,フラッシュをバシャバシャ焚いてて目が痛くなるほどだった.講演の邪魔になるほど写真を撮るのはどうなのかなぁ.
  • 会場写真にチノパンを履いている ryojin3 が足だけ写りこんでいます.到着時間がギリギリだったので,結構後ろの席に座ったんです^^

日本アーカイブズ学会研究会

10/4(土),学習院大学で開かれた日本アーカイブズ学会の2008年度第1回研究会「デジタル情報技術が拓くアーカイブズの可能性」に参加してきました.

プログラム

  • アジア歴史資料センターから見たデジタル・アーカイブズの現在と展望(国立公文書館アジア歴史資料センター調査員,平野宗明(代表),相原佳之,石田徹,蔵原大,黒木信頼,中村元,牧野元紀)
  • 「デジタルアーカイブ」と記録資料 - "正倉院文書データベース"と近代史料のデジタル化を通して - (花園大学文学部文化遺産学科専任講師,後藤真)
上記2件の発表の後,以下の方々と会場を交えたパネルセッションがありました.
本当に気持ちよく晴れている週末の昼下がり,人文系の人たち(特に歴史系の人が多かったのかな)が考えるデジタルアーカイブの議論は非常に白熱して心地よいものでした.

※レポはryojin3の所感であり,講演者の意見・意図が100%反映されているとは限りません!その点ご注意くださいませ.なお,登場する人たちは全て敬称を略させていただいております.



1件目の発表はアジア歴史資料センターデータベース構築作業の話が中心でした.アジ歴(と略すらしい.Webサイトを見てみたら,ヘッダに括弧付きでアジ歴って書いてあった)のDBのデータ構成,アクセス機能,問題点等のお話を聞くことができました.

アジ歴DBのデータ構成

ちなみに,アジ歴の場合,国立公文書館外交史料館防衛省防衛研究所図書館,の各機関がそれぞれマイクロフィルムをデジタル化し,アジ歴がDBにまとめている.マイクロフィルムは文字記載面をモノクロ撮影.細かい解像度やサイズ等の話は聞けず.

画像データ
  • DjVuフォーマット.なんで感たっぷり.
目録データ
  • データ作成フロー
  1. 各機関がメタデータを提供
  2. 外部業者がデータ作成
  3. アジ歴スタッフが内容チェック,DB登録.
メタデータ
  • データフォーマットはEAD.
  • 出力時にはDCの12項目を利用.
メタデータ構成
  • レファレンスコード:資料識別番号.館識別子を頭に付けた12桁.
  • 資料整理コード:資料の配置・配列を表す.館名や件名等を4x10の数値データで表す.
  • 簿冊キー:各館の文書整理番号.館間で違わないのかは不明.
  • オリジナル資料の所在:CDのボリューム名とかって説明があったが,それでわかるのかな...
  • 複製の存在:各館のマイクロフィルムのリール番号.
  • 内容情報:件名表題,作成者名称,作成年月日,記述単位の年代域,言語,規模,組織歴/履歴,範囲と内容/要約

アジ歴DBのアクセス機能

体系化
  • 資料構造を再現するために,リンクで階層構造を実現している.
  • 資料配列を再現するために,資料整理コードを用いている.
シソーラス?
  • アジア歴史資料辞書
  • 検索キーと実データの表記揺れや関連を意味的に結びつける辞書.
検索
  • 50音,階層,キーワード(詳細も),レファレンスコードで検索できる.

アジ歴DBの問題点

スタンス
  • あるものは全部出す.つまり,センターの性格上,公開データの選り好みをせずに,存在する資料は全部公開する方向.
検索精度
  • これは難しい.再現率と適合率の話.
シソーラスの精度
  • 意味的な結び付け方について,検討中.これも相当難しそう.
データの正確さ
  • そもそも原本が間違っている場合がある.誤記の取扱いも検討中.
不足しているもの
  • 人と予算.
  • ユーザ活用の方向も検討中.
情報の保存
  • 基本的にデジタル情報の保存は期限付きと捉えている.
  • エミュレーションやマイグレーションは課題.
  • ここでもやっぱり,人と予算...
まとめ
  • デジタルアーカイブは今後大きな位置を占めるに違いない.
  • 様々な機関DBの統合的利用ができるとうれしい.


2件目の発表は,いくつかのデジタルアーカイブ構築を具体的に行った経験を基に,実際の現状と問題点を整理してみた,という話でした.人文系の方々のこだわりポイントがよくわかり,個人的には非常に興味深く聞くことができました.

正倉院文書データベース SOMODA
  • 正倉院が管理する文書の閲覧システム.
  • 2004~2006年度の科研費/研究成果公開促進費(データベース)
  • 文書の形態は巻物.裏に書かれている戸籍や計帳(税金基礎台帳)も重要.
  • 裏に書かれていたものの都合上,バラバラに管理されていた.
  • 断簡という単位で保存されているので,その単位のままデジタル化.
  • トータル50600画像,20800ページ,35300件.
  • 各種検索機能あり
  • テキストと画像を相互に参照できる仕組み.
  • 画像の勝手利用を防ぐため,40x40ピクセルに分割して表示.

上田貞治郎写真コレクション(大阪市立大学)
  • 上田貞治郎が集めた古写真アルバムのDB化
  • 単位の粒度は「コレクション→アルバム→ページ→写真」と階層化.
  • アルバム単位とは複数の写真が含まれた状態.
  • カラー
2つの取り組みを通して
  • 基本的に史料の構造はそのままで表現する.
  • 史料のデータ構造はバラバラの場合もあるので,その場合は構造化する.
  • デジタルは保存に向かない.
  • ソフト:真正性の確保が困難,デジタルデータは可変性に富みすぎている,等
  • ハード:サーバ維持等のコストがかかる,今まで方式と比べて負荷がかかる,等
デジタルアーカイブのマイナス面
  • これまでのものは優品主義・美術優位・視覚優位の姿勢.
  • 「アーカイブズ」ではない.
デジタルアーカイブのプラス面
  • 文化遺産の振興に貢献.
  • 間接的保存に有効.
  • アーカイブの理解には役立つ.
まとめ
  • デジタル化で保存問題は解決しない.
  • 活用によって保存が進む.


パネルセッション
以下,コメンテータと発表者のコメントを交えて議論が交わされました.

岡本氏のコメント
岡本氏のブログに詳細が載っています.ryojin3はメモ抜粋のみです.

考慮すべきはデータの保存,再構成,提供.

保存
  • 100年単位の保存は難しい.
再構成
  • データは減衰する.
  • データの正確性(=信頼性)と真正性(=信憑性)として考えてみたらどうか.
  • 原本の間違いとデジタルであることによる可変等.
提供
  • デジタルにすることでもたらされることを考えるべき.
  • 情報の活用が進む.
近藤氏のコメント
  • データの戦略的活用ができているか.
  • 保存は原本へのアクセスを低減する.
  • ボーンデジタルの問題.
後藤氏のコメント
  • 岡本氏の「データは減衰する」に賛成.
  • 間違いの多い資料は校正(改訂履歴)も含めてデジタル化すべき.
平野氏のコメント
  • とにかくあるものをデジタル化して提供することが使命と捉えている.
会場から
 Q 使い方はユーザが決めるもので,評価は難しいと思うがどうか.
 A そうはいっても戦略は必要.
 A 提供側は,資料を整理して提示することで評価されやすくなる.
 A 使い方に様々な選択肢があるのはいい.
 A 資料リコメンドのような仕組みはありかも.

 Q 教育利用を考える場合,豊富なメタデータは重要.情報の価値や幅をどう捉えているか.
 A 幅が出るよう,様々な利用形態を考えてみたい.

 Q アーキビストにとって情報技術は何をもたらすのか.
 A 様々な情報技術を用いて,豊富なメタデータを付けやすくなるのではないか.
 A 中の人だけじゃなくて,外の人にも使えるようにするためのツール.
 A 組織間のコミュニケーションツール.

ryojin3の考察

最後の会場とのやりとりがすごく面白かったのですが,聞き入ってしまい,かなりメモを取り損ねました.メモ術は難しいのう.

さて,以下,ryojin3の考察です.

まず,どの発表・コメントにおいてもデジタル保存は難しいという認識が共有されていることが面白い.現状,保存に関してはソフトウェア的な手当てとしてエミュレーションとマイグレーションが主流です.前者はデータ再生環境をソフトウェアで実現する手段,後者はデータや再生ソフトウェアをまるごと新しい環境に移植する手段です.また,ハードウェア的な手当てとして長期間利用可能な持続性を持つストレージの研究開発がなされています.更に,保存用メタデータスキーマやISOの標準等も様々な角度から検討されている状況にあると認識しています.

しかし,これらは現場のアーカイブ作業をする人々からすれば,まだまだ枯れた技術には程遠い,実験的な研究領域を出ていないということなのでしょう.

デジタルを用いないアーカイブの実験として,先日ロゼッタ・プロジェクトのニュースを耳にしました.これは,チタン/ニッケル製の球状の物体に1500もの言語を超微細エッチング加工を施し,情報を後世に残すプロジェクトだそうです.

永久に,という意味ではこれでも不十分なのかもしれませんが(何を永久にするかという定義にもよります),紙やマイクロフィルムよりも長く持つことは明らかです.しかし,このようなやり方は当然膨大な各種資料(紙だけではありません.絵画や博物館の収蔵品,計測も難しい大型遺跡や動く!無形文化財までも)には適用できない部分が多くあります.

その点,あらゆる形式のモノを一元的にデジタル化し,ソフト・ハード両面から,またスキーマのようなデータ構造から長期保存を支えるというアプローチは個人的にありだと考えています.

もちろん,登壇した方々も同じ認識だと思います.ただ,それだけじゃダメだということ.現状ではデジタルと物理的なモノの両方から,複合的に長期保存を行うスキームを構築することが重要なのでしょう.

次に,データの活用についてです.活用は本当に様々なやり方があります.現状だと,Webを使ってインターネット公開をする手法が主流だと言えます.むしろ,それと同義でデジタルアーカイブが語られている場合すらある.

このような現状で,岡本氏の発言は非常に的を得ていたと思います.つまり,データの活用は提供側がコントロールしなくても良い,ということです.近年のインターネット関連企業はまずサービスをリリースし,すぐそのAPIを公開します.これは,サービスの使い方を提供側で規定するのではなく,データ込みで利用者側に工夫してもらおうとする試みです.

自分達が企画した範囲内での利用と,世界中のアイデアを用いた利用とではどちらが有益な使われ方をするか,どちらが多く使われるか,一目瞭然だと思われます.その意味で,ryojin3は岡本氏の考えに賛同できると言えます.

今回の研究会は人文歴史系の方々が多く参加されていたようなので,だいぶアウェイ感がありましたが,非常に面白い研究会でした.

博物館資料台帳の電子化

少し古いですが,博物館総合調査アンケート(H16年実施)に,博物館が管理する資料台帳(メタデータ)の電子化がどの程度進んでいるのかを示すデータが掲載されています.

アンケートそのものを入手したわけではなく,下記文献を参考にしています.

詳細は Google Chart API を用いてグラフ化してみました.ここらへんは趣味です^^

今回の投稿を保存しようとすると,何回も「Blogger.comにアクセスできませんでした」とエラーが出ます.Chartが多すぎるのでしょうか??



まずは電子的にデータベース化した資料台帳の有無です.全体で電子化していると答えた館は35.5%.博物館の場合,管理対象が未知のモノである場合が多く,なかなか台帳を整備できないと聞いていますが,妥当な数字なのでしょうか.

以下,「ある」と答えた720館を対象に細分化しています.



ほとんど全て電子化していると答えた館は40.7%.ひとえに資料台帳と言っても館種によって(あるいは各館によって)スキーマもデータ構造もかなり異なっていると思います.具体的にはどのような台帳が電子化されているのか,気になるところです.

なお,ここらへんの研究は,以下で詳しく紹介されています.前者は理系,後者は人文系の博物館における電子化について言及しています.

情報知識学会・人文社会科学系部会研究会(2007/04/21)より.電子的に参照できないのがつらい.

  • 奥本素子: "博物館・美術館におけるデジタル画像に対する意識について - 館種、規模、デジタル化達成率の違いによる意識の差 - ", 情報知識学会研究報告(2007/4)
  • 北岡タマ子: "人文系博物館の目録情報の現状 - 都道府県博物館への調査結果より - ", 情報知識学会研究報告(2007/4)

以下,館種別の電子化の状況です.ざっと見ると,美術,歴史,自然系(自然史,理工,動物園,植物園,水族館)の電子化が進んでいるようですが,自然系は標本数が少ないことが影響しているかもしれません.



















LOUVRE-DNP MUSEUM LAB

先日,大日本印刷のLOUVRE-DNP MUSEUM LABに行って来ました.


Museum Labは,"Lab"の名が示す通り,ルーブル美術館が持つ様々な美術作品を,大日本印刷の印刷技術/情報技術を用いることで新しい展示や美術体験に応用して行く方法論を模索することを目的としたラボです.

ラボでは当面,2006年から3年間で6つの作品テーマの展示を行う予定だそうで,今回は第4回目のテーマを見て来ました(実はとある委員会の招待で3回目の展覧会も見たのですが,まだここに書いていません.もう忘れ気味...).


この展覧会では,以下3点の技術的取り組みをしています.

  • メディアシオン・ツールとしての地図
  • 体験のさらなる共有化を実現するマルチタッチディスプレイ
  • AR技術の活用により,作品の鑑賞ポイントを分かりやすく

1つ目の地図は,リアプロ,あるいは液晶ディスプレイを用いて大きく高精細な地図の表現をしています.地図は情報の俯瞰,直観的理解に役立つツールとして採用されたそうです.また,メディアシオンとは,フランス語で「媒介」を意味し,作品と人をつなぐツール全般を意味しているそうです.

2つ目のマルチタッチディスプレイは,上記のディスプレイとアクリルで作られた立体地図,更に光センサを組み合わせたインタラクティブな地図です.立体地図を指で触れると,センサが感知し,ディスプレイに情報が表示される仕組みになっています.

3つ目のAR(Augmented Reality:拡張現実)技術とは,目の前にある対象物とコンピュータ上のバーチャル空間を同期させ,目の前の物に関する情報を取得したり,物をバーチャル空間上で動かすことのできる技術です.今回は,目玉の展示品の前に既に同期済の(多分独自開発の)AR端末が置かれており,端末を手で動かすと展示品を様々な角度で閲覧できたり,様々な情報が取得できるようになっていました.また,AR端末にはカメラボタンが付いており,気に入った角度で写真を撮れるようになっています.写真は帰る際にプリントしてお土産としてもらうことができました^^

以下では,より詳細な技術ポイントを紹介しています.


また,上記以外にも面白かった技術ポイントがありました.

  • ガイダンス端末とICタグ

ガイダンス端末はPDA型で(皮のカバーで覆われていたため,どこのメーカーのものか不明),ICタグ・骨伝導イヤホンと組み合わせて使います.まず,入場時に予め使用言語を登録しておきます.その後,ユーザが作品の前に立つと,ICタグと連動するサーバから自動的に選択された音声ガイダンスが配信され,イヤホンで聞き取れる仕組みになっています.骨伝導イヤホンにしているのは,ガイダンスを聞きながら,一緒に来た来場者と会話ができるようにするためだそうです.

また,ICタグは観覧者の閲覧履歴をサーバに返しているようです.受付で入場券をもらえるのですが,入場券に記載されている番号を帰宅後にWebで確認すると,閲覧記録が見られるようになっています.これの仕組みは科博でも取り入れられていたかと思います.

以下,ryojin3の閲覧記録から.



まずは閲覧記録です.ほとんど全てを見たので,全部記録されています.見た順番も分かるともっとよかったかもしれません.



次はAR端末で撮った写真.実際にプリントしたものももらいましたが,Webでも確認できます.「ラスター彩」の皿が飛び跳ねています^^

今回訪問してみて,DNPでは美術体験として「メディアシオン」という概念を導入していたのは非常に素晴らしい取り組みだと実感しました.文化財は様々な角度から見る,あるいは解説されることよってより一層理解が深まると思います.DNPでは情報技術を用いてこれまでの博物館展示にはないアプローチを展開しているのではないでしょうか.

なお,DNPの担当の方が語る記事が以下にありましたので,ご紹介しておきます.写真も豊富なのでここよりむしろ分かりやすいかと思います(ってそれを言っちゃオシマイですね).

Dose metadata matter?

メタデータの概要についてまとめたスライド(130枚)と音声(約30分)です.

eFoundations: Does metadata matter?

ネタ元
スライドキャストで講義「30分でわかるメタデータの歴史・概況」(英国) | カレントアウェアネス・ポータル

制作は英国Eduserv財団,音声はAndy Powell氏(Dublin Coreとかで有名人)なんだとか.個人的にイギリス英語はかなり聞き取りづらいと感じたのですが,メタデータの歴史と概要は非常にうまくまとめられていると思います.

登場するメタデータとその周辺トピック
  • AACR2(the Anglo-American Cataloguing Rules2)
  • DC(Dublin Core)
  • DCMI(Dublin Core Metadata Initiative)
  • FRBR(Functional Requirements for Bibliographic Records)
  • IEEE/LOM(IEEE 1484 Learning Objects Metadata)
  • MARC(Machine-Readable Cataloging)
  • OAI(Open Archives Initiative)
  • OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)
  • repositories
  • SEO(Search Engine Optimization)
  • SRU/SRW(Search/Retrieve via URL, Search/Retrieve Web Service)
  • Z39.50
  • 等など

XML利用実態俯瞰図

以前,XMLの歴史を@NiftyのTimelineというサービスを使ってまとめているというエントリをしました.


なんと!

XMLコンソーシアムでまとめられた「XML利用実態俯瞰図」の6ページ目でryojin3が作ったTimelineが取り上げられていました!


最近忙しくて,XMLの歴史の更新をサボり気味でしたが,これを機に再開しようと思います.
また,XMLの歴史と博物館情報化の関係についてもいろいろ書いてみたいと思っています.

# 今のところ W3C の情報しか載せてないもんなぁ.

Digital Archive links using Google Maps API

Google Maps APIを使って,まずは国内(の有名どころ)のディジタルアーカイブサイトのリンク集でも作ろうかと思っています.なにぶん自動化できないところが多いので,のんびりと作るつもりです.以下は,本家のサンプルを少し改良したものです.Google AJAX API ローダーにちょっぴり苦労しました...
世界の首都:

博物館の資料の状況

現在,日本にはどれくらい博物館資料があるのでしょうか.

文科省の統計データに社会教育調査というものがあり,その中に博物館資料に関する統計があったので整理してみました.

社会教育調査は,社会教育に関する基礎データを収集し,行政用の資料を作ることを目的に3年周期で行われている調査だそうです.この調査によると,博物館は以下のように分類され,分類ごとに統計が取られています.

なお,今回は2005年度の調査結果を用いて整理しています.

博物館の分類
  • 種別
    • 登録博物館,博物館相当施設,博物館類似施設
  • 区分
    • 総合博物館,科学博物館,歴史博物館,美術博物館,野外博物館,動物園,植物園,動植物園,水族館
博物館資料の分類
  • 人文科学資料
    • 実物
      • 古美術資料,近代美術資料,考古学資料,民俗資料,民族・人類学資料,歴史資料,その他
    • 標本
      • 古美術資料,近代美術資料,考古学資料,民俗資料,民族・人類学資料,歴史資料,その他
    • 模型(模写)
      • 古美術資料,近代美術資料,考古学資料,民俗資料,民族・人類学資料,歴史資料,その他
    • 図書
    • 写真
    • その他
  • 自然科学資料
    • 実物
      • 動物資料,植物資料,地学資料,理化学資料,天文資料,その他
    • 標本
      • 動物資料,植物資料,地学資料,理化学資料,天文資料,その他
    • 模型(模写)
      • 動物資料,植物資料,地学資料,理化学資料,天文資料,その他
    • 図書
    • 写真
    • その他
上記の分類を参考に,グラフにまとめなおしてみました.

1.博物館総数

博物館(登録博物館+博物館相当施設+博物館類似施設)の総計です.国内にはトータルで5,614館の博物館があるようです.


図1 博物館総数

内訳は,歴史博物館系(※)が圧倒的に多く,次いで美術,科学,総合となっています.

※ ~系と記載しているのは,相当施設や類似施設も含んでいるためです.

2.博物館資料

2.1 博物館資料総数


次は,5,600を超える博物館(登録博物館+博物館相当施設+博物館類似施設)が抱える資料の総計です.国内にはトータルで158,858,775点の資料があるようです.こんなにあるとは!


図2 博物館資料総数(区分別)

区分別(図2)に見てみると,ほぼ博物館数の割合通りに資料が保持されていることが分かります.面白いのは,総合博物館と科学博物館において,館数と資料数で逆転現象が見られることです.それだけ総合博物館は規模が大きいということでしょうか.

図3 博物館資料総数(分野別)

図3は資料総数を分野毎に計数し直したものです.内訳は人文科学の実物資料が最も多く,約6800万点,総資料数の約44%を占めています.次いで自然科学の標本資料(約3300万点,21%),人文科学の図書資料(約1800万点,11%),人文科学の写真資料(約1200万点,8%)となっています.

2.2 人文科学資料

人文科学に絞って資料の内訳を見てみます.人文科学の資料はトータルで109,352,666点あるようです.


図4 人文科学資料総数(区分別)

図4は博物館(しつこいですが,登録+相当+類似)における人文科学資料の総数です.圧倒的に歴史・総合・美術博物館系が資料を持っていることが分かりますが,それ以外の科学・野外・動植物園等でも微量ながら人文科学の資料を持っているようです.


図5 人文科学資料総数(分野別)

図5は人文科学資料総数を分野別に計数し直したものです.内訳は実物の考古学資料が最も多く,約3900万点,総人文科学資料の約36%を占めています.次いで図書(約1800万点,17%),実物の歴史資料(約1400万点,13%),写真(約1300点,12%)と続きます.

2.3 自然科学資料

同様に,自然科学資料の内訳です.自然科学の資料はトータルで49,506,109点あるようです.


図6 自然科学資料総数(区分別)

図6は博物館(登録+相当+類似)における自然科学資料の総数です.総合,科学,植物で実に全体の92%を占めています.


図7 自然科学資料総数(分野別)

図7は自然科学資料総数を分野別に計数し直したものです.内訳は標本の動物資料が約1200万点で24%,標本の植物資料が約1100万点で22%,実物の植物資料が約768万点で16%,標本その他が約601万点で12%となっています.


3.まとめと今後の課題

今回は,文科省の社会教育調査(2005年度版)を元に,いったい国内には博物館資料がどれほどあるのか,またそれがどんな内訳なのかをざっくりと見てみました.

グラフ化して気づいたことをまとめます.
  • 博物館法上の博物館(登録博物館),それに準じる施設(博物館相当施設)は少ない.多くは博物館法適用外の博物館類似施設である.
  • 人文科学の資料は自然科学と比べて多い.
  • 人文科学の資料には実物が多い.標本や模型は少ないが,代わり?となる写真や図書が多い.
  • 自然科学の資料には標本が多い.動植物は実物を管理しづらいせいか?また,標本や模型(模写)で代用できるためか,写真や図書は少ない.
  • 自然科学の標本の多くは動植物園ではなく,総合・科学博物館で管理されている?
また,今後の課題として,以下を挙げておきます.

言葉の定義
  • 統計では「資料」という言葉が使われています.そもそも資料って何でしょう.恐らく,美術工芸品や民俗学的に貴重な生活用品,鉱石 や剥製のみならず,それに関連するドキュメントや写真,図書等をまとめて「資料」と呼んでいるのだと思います.もしかしたら,市販されている報告書には定 義付けがなされているかもしれませんが,「収蔵品とそれ以外」について,定義の再確認をしてみたいです.
年別の資料数の推移
  • ネットでは平成11年(1999),平成14年(2002),平成17年(2005),の3回の調査結果が載っています.ちょうど今年は調査の年に当たります.過去と併せて資料数の推移を確認してみたいです.
分類方法
  • 統計では「その他」項目に含まれる資料も多数存在します.これらはどのように分類されたのか,また,そもそもどのようなモノがどのような項目に分類されたのか,(これも報告書に記載されているかもしれませんが)調べてみたいです.
種別
  • 具体的にどの博物館がどの種別に分類されているのか,またその選別プロセスについて調べてみたいです.
ディジタルアーカイブの現状との比較
  • これほどボリュームがある博物館資料,近年ではディジタルアーカイブ化も進んでいると聞きます.博物館資料と比較したディジタルアーカイブの現状について調べてみたいです.

研究資源共有化システム

日経新聞(5/10)でも取り上げられたようなのでご存知の方も多いでしょうが,大学共同利用機関法人 人間文化研究機構では,研究資源共有化事業が進められています.

その柱は,1)データベースの拡充,高次化と 2)研究資源を共有するための情報環境の創出です.

1)に関しては,各研究機関が持つデータベース(以下,DB)の質的・量的拡充とGISデータの作成等が行われています.また,2)に関しては,「研究資源共有化システム」と総称する情報システムの開発が行われています.

今回は,2008年4月から公開になった「研究資源共有化システム」について書いてみたいと思います.

なお,このあたりの事情は,2008年3月14日に行われた研究資源共有化シンポジウム「研究資源共有化 - その展開と可能性 - 」に講演予稿集がアップされていますので,そちらも併せてご参考下さい.

1. 研究資源共有化システムの概要

事業紹介ページによれば,このシステムは以下の3システムから成ります(2006年度から開発開始,2008年4月から運用開始).
  1. 統合検索システム
    • DBシステム.各研究機関が公開しているDBの横断・統合検索を実現する.
  2. nihuONEシステム
    • DBシステム.研究者自身による容易なDB作成,研究支援機能を持つ.2008年5月16日現在,非公開.近日公開予定らしい.
  3. GT-Map/GT-Timeシステム
    • アプリケーション.時間情報や空間情報(地理情報)に基づいた分析を可能にする.2008年5月16日現在,非公開.近日公開予定らしい.
2,3はまだ一般公開されていません.また,ryojin3的に最もホットなトピックは統合検索システムだと考えているので,そこについてまとめます.

2. 統合検索システムの概要

統合検索システムは,人間文化機構を構成する5研究機関が提供する108のDBに対して,一括で横断検索,個々のDBが持つ時間・空間情報を用いた統合表示ができるシステムです.

以下は対象となる5研究機関です(トップページではなく,個々のDB紹介ページにリンクしています).
また,各機関のサイトから統合検索システムへのリンクが貼られています.

統合検索システムのシステム構成は以下のようになっています.



図は以下から抜粋しました.
各機関の情報システムのフロントにFront End System(以下,FES)とGate Way System(以下,GWS)が配置され,FESで各DBのメタデータの違いが吸収され,FESとGWSの連携により,ユーザはWebから横断検索が可能となります.

FESは,各機関の各DBの項目を共通のメタデータ項目にマッピングし,マッピング情報をメタデータデータベース(以下,MDB)で保持するシステムです.図を見ると,サーバサイドのMDB検索システムやOAI-PMHのリポジトリ機能も備えているようです.

また,GWSとは,異なるプロトコルや媒体を使う他のネットワークシステムに接続するためのソフトウェア(いわゆるゲートウェイ)のことを指し,ここでは,Webブラウザからの検索要求をFESに渡すクライアントサイドのMDB検索システムになります.プロトコルには図書館管理システムでよく使われているZ39.50SOAPを用いてXMLで要求を送るSRW(Search/Retrieve Web Service)が採用されています.

他にも,検索システムの運用管理に特化したシステム,共通ユーザインターフェースの採用等,面白い試みがなされていますが,ryojin3が一番気になるのは,やはり,どうやって108ものDBの項目を「共通のメタデータ項目」にマッピングしているのか,という部分になります.

3. 統合検索システムにおける共通メタデータ

山本泰則: "データベース横断検索のための共通メタデータ - 統合検索システムにおける定義と2つの課題 - ", 人間文化研究機構研究資源共有化シンポジウム「研究資源共有化 - その展開と可能性」講演予稿集, pp.16-21, 2008.(PDF)によれば,このシステムで採用している共通メタデータには,以下の3種類があります.
  • Dublin Core
    • 基本15エレメントを用いている.精密化(qualifier)はしていない(方言が多いから??)
  • 5W1H
    • いつ,どこで,誰が,何を,なぜ,どのように
  • 時空間情報
    • 時間情報:日付,年代,時代
    • 空間情報:住所,地域,国,緯度経度
これらのメタデータに以下の規則を適用したようです.

NIHUメタデータマッピング規則
(以下は論文の抜粋で,全規則は現在未公開のようです)
  • Dublin Core(以下,DC)
    • 原DBの記述対象はDCのResourceとする.
    • 原DBでの表示対象情報はすべて表示.つまりDCのいずれかに割り当てる.
    • Resourceの内容が対象とする時間範囲はDCのCoverage(Temporal)とする.
    • Resourceに起きた事象に関する時間情報はDCのDataとする.
    • Resourceの内容が対象とする地理的情報はDCのCoverage(Spatial)とする.
    • Resourceが製作あるいは使用された地理的情報はDCのCoverage(Spatial)とする.
  • 5W1H
    • マッピング対象はWho,What,When,Whereとする.
    • 文で記述された情報や備考,上記4つにマッピングできない情報はOtherにマッピングする.
  • 時空間情報
    • 時間情報は正規化した時間の区分で表現する.
    • 空間情報は緯度経度の矩形範囲で表現する.
      • 矩形範囲は北西端と南東端の組.
    • 原DBでの記述表現は適切と判断される数値範囲に変換する.
    • 原DBでの記述表現は別途残す.
  • その他
    • DCでは別途検索用,結果表示用のメタデータを設ける.
    • 原DBの各項目を上記それぞれのメタデータ及びAnyに独立でマッピングする.
    • 5W1Hは検索のみで使用し,結果表示はDCを用いる.
4. マッピングの課題

NIHUメタデータマッピング規則を策定するにあたり,様々な課題があったようです.
  • モノ情報に関する問題
    • 原DBが管理するモノはDCの場合,Resource(資源)かContents(内容)か.
    • DCの場合,(楽器や土器等)モノによってType,Subject,Description等複数の項目に割り当ての可能性がある.
  • 時間情報に関する問題
    • DCのResourceに生じた時間情報(製作時期,使用年代等)はDCのDateが適用.
    • DCのCoverageには資源の内容が表している時間的な範囲がある.
  • 空間情報に関する問題
    • DCのCoverage(Spatial)が有力だが,資源そのものの空間的情報(製作地,使用地等)は記述項目がない.
    • DBによって表記が様々.「縄文時代中期」とか「ジャワ島東南部海岸地域」等.
  • Creator情報に関する問題
    • 例えば何らかの演奏の場合,DCのCreatorは演者か,記録者か.
  • モノと時間に関する問題
    • 時間と共に管理内容が変化するケースがある.
      • ex)手紙:当初は内容が重要だが,時代を経ると素材や折り目等,素材も重要になる.
  • 一般的な問題
    • DCにマッピングすることで,個々の要素の定義や意味があいまいになる場合がある.
    • DCのAnyを用いることで一部回避しているが,原DBの全項目のマッピングが本当に必要かどうか検討を要する.
    • 時空間情報では一部矩形範囲に正規化したが,それが妥当かどうか検証を要する.
    • DCのDumb-Down規則に反する部分が出てきた.
ryojin3の考察

さて,一連の概要を読んでの考察です.

今回は人間文化研究機構の研究資源共有化事業の1つである研究資源共有化システム,それも統合検索システムのみをフォーカスして書きました.

このシステムは,100を超える人文系DBを共通メタデータと1つのインターフェースで連動させたという点で,高い利便性が実現できたと言うことができると思います.

もちろん,これまでにも博物館情報を連携する同様の試みはいくつかあります.
例えば,前回書いた国立美術館の情報連携や文化遺産オンラインもそうですし,自然科学系の分野では,地球規模生物多様性情報機構(GBIF:Global Biodiversity Information Facility)の試みがあります.GBIFでは,Darwin Coreという標本・観察データを記述できるXML形式の標準と専用プロトコルを用い,動物・植物・微生物・菌類・タンパク質データや生態系データにいたるまで,様々な機関で蓄積された種々のデータを世界規模で相互利用しようとしています.

自然科学系は対象が違いすぎるので,また別の機会に掘り下げるとして,人文科学系の博物館情報の連携という観点でこのシステムを見てみると,やはりそこではメタデータマッピングにおける意味的なずれが生じていることが問題となっています.

山本氏は論文の最後で,このシステムを用いても全DBをあたかも1つのDBのように利用できることにはならない,と締めくくっています.氏は個々のDBができた経緯から共通メタデータの限界に触れ,キチンとした横断検索を実現する手段として,統合検索システムで全DBをスキャンし,関心があるDBについては個々のDBを精密に検索する,そのような二段構えの仕組みが必要だとしています.

ryojin3もこの意見には賛成です.ただ,どうせなら全DBをスキャンした段階である程度ユーザが欲する(と思われる)ジャンル(スキーマ)を提示できる仕組みがあると,なおいいなと考えています.

観光立国の現状

外国語の案内職員配置18% 博物館の観光対応は不十分(47 NEWS)

出るかなと思って少し待っていたのですが,まだ各省のページにはニュースリリースが見当たりません.GW 明けなのかな.

もう少し情報収集してから,情報提供サービスについていろいろ考えてみたいと思います.

「独立行政法人国立美術館における情報<連携>の試み」を読んで

東京国立近代美術館が全文pdfで閲覧が可能な研究紀要第12号(2008.04.08)を発行しています.

その中で,美術館の情報連携に関する論文が発表されていました.
この論文について,少しまとめておきます.

主な要点は以下の通りです.
  1. 既に公開されている情報資源の整理
  2. いろいろな連携プロジェクトの紹介
    • 所蔵作品総合目録検索システムと文化遺産オンラインの情報連携
    • 美術館の所蔵図書の情報連携(ALCとWebcat)
    • 所蔵作品・所蔵図書・アートコモンズと想 - IMAGINEの情報連携
  3. 考察
それぞれについて,簡単な解説と考察を加えます.

1. 既に公開されている情報資源の整理

国立美術館とは
国立美術館の公開情報
上記の公開情報と国立美術館の事業展開は,国立美術館のWebサイトからリンクしてあるが,システム・運営主体(各館)・法人としてのプレゼンス(存在感)を向上させるためには,間口(人,方法,機会等)を広げ,更なる他関連機構との連携が必要.

2. いろいろな連携プロジェクトの紹介

■所蔵作品総合目録検索システムと文化遺産オンラインの情報連携

文化遺産オンラインとは
  • 文化庁の文化財ポータルサイト
  • 2007年10月現在80館が参加
  • 2008年4月現在60359件が公開
  • 各館から文化遺産オンラインへの登録方法
    • CSV形式でDBにインポート
    • オンラインで作品を1点ずつ登録
実証実験(1)
実証実験(2)
  • 4館総合目録を実証実験(1)の方法で文化遺産オンラインが収集
  • 2007年10月に実施
  • 登録件数が577件から28000件あまりに増加
  • 内訳
    • 東京国立近代美術館 11831点
    • 京都国立近代美術館 6950点
    • 国立西洋美術館 4242点
    • 国立国際美術館 5330点
    • 計 28353点
■美術館の所蔵図書の情報連携(ALCとWebcat)

ALC(Art Libraries Consortium)とは
  • 美術図書館連絡会.参加館が図書情報を持ち寄り,美術図書の館横断検索システムを提供している.
Webcatとは
  • 学術研究目的の図書情報検索サービス.
情報連携の流れ
■所蔵作品・所蔵図書・アートコモンズと想 - IMAGINEの情報連携

想 - IMAGINE - とは
  • 国立情報学研究所が開発した検索システム.複数のDBを一覧できるインターフェースと各DBを検索する連想検索エンジン「GETA」を持つ.
想 - IMAGINE Arts 構想
アートコモンズとは
  • 国立新美術館の展覧会情報サービス.
  • 2007年12月現在,以下の情報を提供.
  • 展覧会情報 12313件
  • 美術館・美術団体・画廊情報 約600件
  • 情報は増える一方で,コストの都合上情報提供の質を上げるのは困難になりつつある.
予備実験(1)
  • 4館総合目録(文化遺産オンライン実証実験(2)で用いたデータ)をGETAに食わせる実験.
  • 2007年度に実施.
予備実験(2)
  • アートコモンズから出力した展覧会情報から検索用メタデータを抽出.
  • メタデータは想 - IMAGINE Artsに登録.
  • 登録することで,文化遺産オンラインや東京国立博物館名品ギャラリー等と共に横断検索・情報提供が可能となった.
3. 考察

■メタデータの利用
  • アートコモンズと想 - IMAGINE Artsの連携予備実験からもわかるように,アートコモンズの情報をメタデータ化し,様々なシステムで利用することでメタデータを介した緩やかなシステム連携が可能.
  • アートコモンズに限らず,各館で管理している情報群(4館総合目録や,図書情報)からメタデータを抽出,構造化しておくことでメタデータを媒介に様々なシステム連携が可能かもしれない.
長くなりましたが,以上が論文のまとめです.長すぎてあまりまとまっていないか...

ryojin3の考察

さて,この論文を読んでの考察です.

このような取り組みはユーザにとっては非常に嬉しいものです.なぜなら,ユーザにとって利便性(検索システム毎に検索方法を覚えなくて良い)・網羅性(一度の検索で複数のシステムを検索できる)・質の確保(美術館のお済み付きの情報)といった観点から非常に有益だと考えられるからです.

また,メタデータを用いてシステムを媒介させるアプローチも正解だと思います.メタデータは人間の知識が反映されたものであり,コンピュータはメタデータを指針に,ユーザの欲する解を探しやすくなると言えます.

ここで問題なのは,どのようにメタデータをハンドリングすべきかに帰着するでしょう.

例えば,4館総合目録と文化遺産オンラインの連携では,目録を文化遺産オンライン形式に変換することで連携を実現しています.目録のどの項目を文化遺産オンラインのどの項目にマッピングすべきかを考えるには,専門家の知識が求められます.

また,アートコモンズの展覧会情報はChasenで形態素解析され,必要と思われる語彙をメタデータとしてGETAに食わせることで想 - IMAGINE Artsでの検索を実現しています.ここでは形態素解析の結果から必要語彙を抽出し辞書を作成する作業はやはり専門家が行うことになります.

専門家が用意したマッピングパターンや語彙は,一般ユーザが行ったそれと比べ,信頼性が高いのは事実です.しかし,専門家と言えども人間が行うそれらの行為には,どうしてもマッピングのずれ(本当に正しい対応が取れているか)や,必要な語彙のずれ(本当に必要な語彙が選定されているか)が生じると思われます.

また,今回の論文では取り上げられていませんでしたが,博物館系のメタデータには,これまで他の投稿記事で述べた通り,世界的あるいは国内の標準と呼ばれる形式があります.これらの標準メタデータ形式を中間形式としてデータの相互変換を行うことも考えられますが,やはりキッチリやろうとすると,上述のようなずれが生じやすくなります.

このようなずれを解消するためには,キッチリとしたメタデータの運用(ある特定のメタデータ形式にマッピングするとか,必要な語彙を選定する,等)はさほど重要ではないのかもしれません.つまり,各館が管理するデータベースのスキーマを,インターオペラビリティの確保を前提に,緩やかに分解統合できるような仕組みが必要になるのだと思います.

そのような仕組みについて考えていることがありますが,それはまた次回^^

CERCA TROVA

日テレ「天才ダ・ヴィンチ 伝説の巨大壁画発見!」を見ました.
と言ってもたまたま見つけたので,1時間過ぎているあたりからの視聴です.

内容はだいたい以下のような感じでした.
美術解析学者のマウリッツィオ・セラチーニ博士は30年前、フィレンツェにあるヴェッキオ宮殿の広間を調査中、「五百人広間」を飾るヴァザーリの壁画の中に『CERCA TROVA』(探せよ、さらば見つからん)と書かれた小さな旗を見つけた。それは、500年前に失われたはずのダ・ヴィンチの巨大壁画「アンギアリの戦い」が、まさにここにあるという暗号であった。市当局の許可を受けた博士は、X線やレーダーなどの科学技術を駆使し、ヴァザーリの壁画を損傷することなく、その壁画の後ろに2cmほどのすき間があることを確認。さらに「アンギアリの戦い」の絵の輪郭や、絵の具の色まで解析している。

どらく2008.04.08,荒俣宏氏コラム

Seracini氏はEDITECHの中心人物で,カリフォルニア大学サンディエゴ校でCISA3というプロジェクトをやっているそうです.チラリと日本人スタッフも出てきて,おお,こんなところでも頑張っている日本人がいるのだなと少し感動しました.

なんだかいろいろ面白そうなことをしているようです.今度,もっと丁寧に見てみようと思います.

参考URL

コンタクト情報

お知らせです.

コンタクト情報をサイドバーに付けました.
メールは晒すとスパムが多いので,画像にしてあります.
画像はE-mail icon generatorで作りました.

CRM: The CIDOC Conceptual Reference Model(1)

前回,ICOM/CIDOCの取り組み(2)で博物館情報用のデータモデルについて簡単に触れました.特に,「概念参照モデル」(CRM: the CIDOC Conceptual Reference Model)については以下のような説明を加え,

CRMとは,一言で言うと「オントロジを用いた情報記述の枠組み」になります.これまでの提案のようにスキーマ設計の指針(具体的なフィールド名等)となるガイドラインとは異なり,文化財に関する基本概念をオントロジを用いて記述するのです.

オントロジとは,これまた一言で言うならば,「分類体系と推論ルール集」になります.世界にあるモノを体系的に分類し,それらの関係性を記述するものがオントロジです.具体的には諸々の書き方がありますが,CRMではRDF/XMLを利用することになります.

更に,RDF/XMLについてエントリしました.

今回は,RDF/XMLに基づくCRMの詳細について書いてみたいと思います.

CRMの考え方

CRMは,「データベースにどのような情報(フィールド名)を記述すべきか」を言及したものではありません.文化財の管理に対して,既に何らかのデータベースが動いている状態を前提としており,これらのデータベースから,洩れがなく,かつ発見的にデータを統合・交換するための「枠組み」を提供しようというものです.

例えば,ある所蔵品管理データベースでは,管理項目として「作品の名称」「作者」「年代」が管理されているとします.CRMでは,「「作品の名称」は「作者」によって「年代」に作られた」といったような項目間の関係性(RDF/XMLの文)を作り,このデータベースが持つ情報に意味を与えます.他方,別の所蔵品管理データベースでは,「作品の名称」「出処」「関連文献」が管理されているとします.CRMでは「「作品の名称」は「出処」で見つかり,「関連文献」がある」といった関係性を作り,このデータベースが持つ情報に意味を与えます.双方の文をマージすると,「「作者」によって「年代」に作られた「作品の名称」は「出処」で見つかり,「関連文献」がある」という文になり,双方のデータベースが無理なく統合されるわけです.また,それぞれのデータベースから見れば,新たな項目が発見されたとも言えるわけです.

実際にはデータベースはもっと複雑な構造をしており,また管理項目も多種多様です.しかし,概念(上の例ではデータベースの管理項目.ただし概念=管理項目ではない)の関係性を表現し,その関係性を用いてデータの統合や交換の実現を目指したものがCRMと言うことができます.

具体例

では,以下にCRMの例を示します.これはDefinition of the CIDOC CRMのサンプル例を参考に作ったものです.

CRMの最新バージョンは,2008年4月12日現在,4.2.1(あれ? 少し前に調べた時は4.2.2だったような...)で,84のエンティティ,141のプロパティが定義されています.CRMではドメインで使用される概念クラスをエンティティと呼び,エンティティ間の関係をプロパティと呼びます.



この例では,空間情報(文化財の所在)を表現するため,
  • E39 Actor(行為体:個人・グループ等,資料に関わりを持つ人)
  • E51 Contact Point(問い合わせ先:メールアドレスや電話番号,住所等)
  • E41 Appellation(呼称:名称.数値や文字列等)
  • E53 Place(場所)
  • E70 Things(もの:識別可能な単位)
の5つのエンティティを中心に複数のエンティティが階層構造で表現され,かつその関係がプロパティで記述されています.

ツール

CRM本家のToolsでは,各種ツールが公開されています.

可視化ツール(svg file)
  • CRMで定義されるエンティティとプロパティを,ICS-FORTH RDF Suiteを使い,SVGで表現するツール.
  • ブラウザはIE(とAdobe SVG Viewer)を用いないとパースエラーが出るので注意.
  • CRMのバージョンは3.2.
変換ツール
  • XML to RDF translator(zip-file)
    • XMLからRDFに変換するツールを用い,CRMと互換のあるRDFを出力する.
    • コマンドラインベースのツール.シンプルで良さそう.
  • CRM-XML mapping Utility(zip-file)
    • Accessで作られたツール.
    • 設定がよくわからない.設定をスキップして実行しようとしたら OLE サーバと ActiveX コントロールのエラーが出た.
チュートリアル(マッピング関係)
まとめ

今回は,まずCRMの考え方を示しました.次に具体例とツールの説明を交えながら,CRMの概要について書きました.次回は実際にツールを使い,どのようにデータを作っていくのか書いてみたいと思います.

参考文献

  • 本家
    • Definition of the CIDOC CRM
    • Definition of the CIDOC object-oriented Conceptual Reference Model
    • Definition of the CIDOC object-oriented Conceptual Reference Model and Crossreference Manual

文化財の輸送

先日(年度末なので,だいぶ前...),東京国立博物館「国宝 薬師寺展」を見てきました.

さすがに日光月光は(見ている人も含めて)すごい迫力でした.私が気に入ったのは特に背中.丸みを帯びて,優しい感じがしました(普段見ることができないという思いがそう感じさせたのかもしれませんケド).ただ,会場が全体的に赤っぽいデザインでなんとなく見づらかった.あれは昔のお寺をイメージしているのかしら.ライティングとか絶妙だっただけに個人的には赤い柱は邪魔だったなぁ.

それはそうと,この仏像たちは,はるばる薬師寺から上野までやってきたわけですが,輸送にはとても気を使ったことでしょう.

たまたまテレビを見ていたら,日光月光が日本通運のトラックで運び出されている様子が映っていました.日本通運はこの手の輸送には定評があるようです.


また,最近はあまり広報していないようですが,過去にはこんな広報がありました.


そして,驚きなのは厚生労働省が行っている「現代の名工」という卓越した技能者に送る賞を取ってたりするんです.2回も!


うん.

なんか日通の回し者っぽくなってきちゃいましたね.でも,現代の名工で美術品梱包輸送技能者が選ばれたのはこれまで日通しかいないそうです.

今回は日通の宣伝(!?)がメインになってしまいましたが,今度は保険や輸送時の技術(揺れの吸収とか湿度・温度管理等)についてもいろいろ調べてみたいと思っています.

ディジタルアーカイブの長期利用に関するシンポジウム

3/14(金),筑波大学まで行って来ました.IPSJの全国大会が開催されており,活気を帯びていましたが,学び舎は古くなり,やや疲れた感じがしました.

お目当ては以下のシンポジウム.

ディジタルアーカイブの長期利用に関するシンポジウム

プログラム

13:00 - 15:00 講演
  • Short Introduction, Heike Neuroth (Goettingen State and University Library, Max Planck Digital Library Berlin)
  • Organizational Issues: Trusted Repositories/Archives, Policy. Stefan Strathmann (Goettingen State and University Library)
  • Technical Issues: kopal, repository systems, ingest, validation. Heike Neuroth
15:30-17:00 ディスカッション(ラウンドテーブル)
  • ゲッチンゲン大学+国立国会図書館+国立公文書館+筑波大
後半のディスカッションが見所かと思いますが,ディスカッション前の休憩時間に恩師を訪ねたのが運の尽き.久しぶりの再開に話が弾んでしまい,後半まるごとブッチしてしまいました.何しに筑波まで行ったんだか...ま,恩師の元気な姿が見れたから良しとするか.

なので,今回の投稿は前半部のみです.

Short Introduction, Heike Neuroth (Goettingen State and University Library, Max Planck Digital Library Berlin)

Organizational Issues: Trusted Repositories/Archives, Policy. Stefan Strathmann (Goettingen State and University Library)

Technical Issues: kopal, repository systems, ingest, validation. Heike Neuroth
  • 当面の課題
    • ディジタル情報は元来複雑
    • 個人の要求は全く異種
    • 一般的な品質の評価基準は抽象的
    • フレームワークは実装レベルと程遠い
    • リポジトリソフトは複雑
    • システムの品質は個々の設定に大きく依存する
    • 製品のドキュメントは依然問題
  • Decision Process
    1. 参照モデル,技術,ユースケースから評価基準カタログ(Criteria Catalog)を作る.
    2. 市場のアーカイブ製品を調べる.
    3. 1,2をRatingし,製品比較を行い,ランク付けをする.
    4. 3と併せて個々の要求分析等を行い,
    5. 製品を選定する
  • 評価カタログの詳細(やや手抜き)
    • カタログ構造
    • 一般的な属性
    • 機能的な属性(取り込み,アクセス,ストレージ,アドミン)
    • 非機能的な属性(コスト,品質)
  • 具体例

前半戦 質疑
[Q]アーカイブへの多様なアクセスはどう考えている?
[A]アーカイブ用とアクセス用は分けて考えたほうが良い.

[Q]州と大学の図書館ということだが,州図書館としての役割は?(リポジトリシステムの中には高いものもある.)
[A]システム導入時のコンサルティング代行,システムレンタル等の運用を通して市町村等予算の少ない図書館のサポートができたら良いと考えている.

[Q]TRAC,DRAMBORA,nestorの違いを教えて欲しい.
[A]nestorとTRACは自己評価用.DRAMBORAはリスク評価用.

[C]ディジタルアーカイブは,評価・選別・廃棄のサイクルが大事.永久に残すものとそうでないものに分ける必要性を感じた.

[Q]アクセスフォーマットはネットワークのものとアーカイブのものは異なるのか?
[A]異なる.例えば,原本はtiffで,公開はjpgで,のように.

[Q]原本をサポートするツール(読みづらい昔の文字を現代の文字に変換するスクリプトのようなもの等)を用いる場合があるが,これもアーカイブの対象か?
[A]対象だ.ただし,原本とツールは異なることを理解する必要がある.


後半のディスカッションの前に,国立国会図書館のディジタルアーカイブの話と国立公文書館のディジタルアーカイブの話があったかと思われます(資料は手元にある).しかし,先の説明の通り,講演を聞いていないので,今回は割愛させて頂きます.

ETV特集「フィールドへ異文化の知をひらく」を見る

先ほど,国立民族学博物館文化人類学に関するテレビ番組を見ました.


直接的に博物館情報学とはリンクしないかもしれませんが,異文化/多文化を理解し,共生するための手法である「文化人類学」は,様々な異種データ群をメタデータを介して交換・統合していく世界と似たものを感じ,またそういう世界は博物館情報学の一側面であると感じたので,エントリしてみます.

残念ながら,途中(22:30くらい)からの視聴なので,前半部はどういう放送だったのかわかりません(^^; 以下,後半部のまとめです.

■研究する側される側の関係
  • 例1:アイヌの踊り(=文化)を博物館を介して発信する.
  • 例2:ペルーの博物館は日本人が建てて,運営は地元の人.
  • 遺物(の意味)とは,語り/昔の言い伝え/地元の人々の記憶等との併せて考えるもの.また,その活用も大事.
  • 風土を作るには,土の人(→地元民)と風の人(→旅人)がお互いにいい影響をしあうことが大事.
  • 他者との関係・認識のあり方は,対話・時間と空間の共有を通して少しずつ変わっていくしかない.
■異文化理解・多文化共生を深めるには
  • 松園さん
    • 文化人類学者は土地に入り,土地の人達とともに生活をする.最初は土地のことがよくわからないが,だんだん分かってくる.謎解きの面白さのように,忍耐強く,人に寛容である必要がある.
  • 鷲田さん
    • 異文化理解や多文化共生には,他者と考えや気持ちが同じになるということではない.むしろ,交われば交わるほど,お互いの差異が際立ってくる.そしてその事実を受け入れることが大事.フィールドワークを通して,他者の世界観を身体的な感覚で汲み取ろうとするのは重要なこと.
  • 関野さん
    • 文化相対主義とは,上下関係ではなく,文化を相対的に見るもの.
  • 松園さん
    • 多文化共生への努力は,様々な味付けの料理を食べられるということ.

■広がる研究フィールド
  • 例1:タイ・ランプーンにおける日本文化とタイ文化の比較,平井京之助さん
    • 1980年末に日本企業のエレクトロニクス関係の工場ができたことによる,周辺地域への影響について調査.
    • 異文化が地域に与える影響(いい面も悪い面も含めて)を調べることで,双方が良くなる手助けをする.
    • グローバル化→文化人類学のフィールドの広がり→調査対象と研究対象/内容が広がる.
  • 例2:パプアニューギニアの津波(1998)と新潟県中越沖地震(2004)を通した,災害の復興調査,林勲男さん
    • パプアニューギニア津波では,支援がNGOの名声のために利用されたり,パプアニューギニア文化を無視した支援が一部であった.
    • 新潟では,被災者個々人の思いを聞いて回り,体験記録集の作成した.このような記録は震災の教訓・知恵を次の世代に伝える手助けとなる.
    • ネットワーク作りの大切さ:地元外NGO+地元=復興の企画等(震央米).
    • 林氏の目指すところ
      • 防災を含めた人々の安全な暮らしの確保を考える.
      • 行政,ボランティア,研究等様々な立場の人が知恵を出し合って取り組む分野.
      • 文化人類学的には,災害現場の状況理解をまとめ,次世代に伝えることが大事.
  • 例3:医療分野や開発協力への適応,白川千尋さん
    • マラリアの感染には有効予防接種がないので,蚊帳が有効だが,現地では多くの人が蚊帳を使ってくれなかった.
    • 蚊帳を配るだけでなく,それを使ってもらえるような方策を考えることが大事.
    • 現地には多様なニーズがある.それにあったきめ細かいサポートを提供するため,対象者のありようをきめ細かく見ておく必要がある.ここで文化人類学的な視点が重要で,「開発人類学」が形成されつつある.
    • 開発を成功させるためのブローカーになるのではなく,以下が大事.
      1. 地域の社会情報・文化情報を提供し,
      2. 常識を別の角度から見直して相対化する.
■文化人類学の課題
  • 鷲田さん
    • 今の文化人類学
      • グローバル化→複雑なファクター/コンテキストが絡み合っている.
      • コンテキストの多層性・多次元性→文化を多元的に調べる.
    • この状況で,文化人類学は野生的でなくなってきた.
  • 松園さん
    • 文化人類学は長い歴史の中で全体として人間を見る.現代は対象の外から様々な要素が入り込み,対象が複雑になっている.その状態で文化人類学者は刻々と移り変わる対象に目を奪われ,長いスパンで考えられにくくなってきている.これは問題だ.
  • 鷲田さん
    • そうは言っても,複雑性への感覚はスゴイ.繊細なコンテキストへの意識はスゴイ.
  • 関野さん(まとめ)
    • 人間とは何か,私とは何か.
    • 世界中にくまなく広がり,環境の中・文化の中で人間とは何かを明らかにする.
    • 環境/紛争/資源等々の問題にも文化人類学的手法は有効.

参加シンポジウム等の整理

年度末ですし...

2003年末頃から参加した研究会やシンポジウムをピックアップしてみました.

当時のメモを元に,ヒマを見ては詳細や私見を公開して行こうと思っています.アップは当時の日付に併せて行うと思いますので,都度新しいエントリとしてご紹介します.

既にこのblogで紹介したイベントに関しては,ここのblogのリンクを貼っています.

■2004年■2005年
■2006年
■2007年
■2008年

あれ...なんかもっといろいろ参加した気がするんだけどなぁ...

画像電子学会 第6回 画像ミュージアム研究会

2008/2/29(金),画像電子学会の第6回 画像ミュージアム研究会(pdf)に行って来ました.

発表は4件と少なめながら,非常に有意義な議論に参加することができました.

以下,参加レポです.

※レポはryojin3の所感であり,講演者の意見・意図が100%反映されているとは限りません!その点ご注意くださいませ.

※今回は,有料の研究会だったため(資料代なので問題ないとは思いますが),内容については簡単にしか書いていません.詳細は画像電子学会Webサイトもしくは研究会Webサイトでご確認下さい.情報があまりないかもしれませんケド...



報告
  • タイトル:Font Museumの公開
  • 著者(○は発表者):○長村玄,小町祐史,上村圭介:情報規格調査会 SC34/WG2小委員会)

  • Font Museumについて.その問題意識や意義について.
    • 実際の活字の収蔵の問題
    • 活字のディジタル化の問題
    • ディジタル化することによる著作権の問題
    • ビジネスの方向性,等



報告
  • タイトル:進化計算アルゴリズムの視覚化と展示への応用
  • 著者(○は発表者):○田島悠史,桐山孝司:東京芸術大学大学院映像研究科




報告
  • タイトル:土器画像検索システムと展示への応用の検討
  • 著者(○は発表者):○茂呂優太,徳永幸生,杉山精:芝浦工業大学

  • 以下の超2次関数を使って,土器画像から特徴パラメータを取得し,補助パラメータ(ここでは省略)と合わせて土器画像を分類検索するシステム.
  • 上式において,各記号は以下を表す.
    • a1,a2,a3 は xyz 各軸における長さ
    • ε1,ε2 は xz・xy 各平面における角張り具合
    • k1,k2 は z 軸方向の先細り度合い
    • y = 0 として上式を使用している.
  • この式は,国立歴史民俗博物館の土器画像 200 枚に適用.
  • ペン入力やテンプレートを選択できるような UI を用意し,入力値と特徴を比較,適合結果を返す仕組み.
  • 国立歴史民俗博物館企画展示「弥生はいつから!?」で実証実験.
  • アンケートで評価.



報告
  • タイトル:部分的分類知識の統合による博物館情報の横断検索の提案
  • 著者(○は発表者):○山田 篤,小町祐史,安達文夫:京都高度技術研究所,大阪工業大学,国立歴史民俗博物館
  • 博物館同士の情報交換(横断検索)が目的.
  • 各館の分類知識を統合するポータルサイトを作って検索するのが望ましい.
  • 各館の分類知識の統合方法は,
    • 特定ジャンルの複数のコレクションに含まれる資料名称をもとに,分類語彙を設定.
    • 分類語彙中,他のコレクションと共通で現れた語がキー.
    • コレクション同士の類似度は以下の式で計算する.
      • AとBの共通語彙数×2 ÷ (Aの語彙数+Bの語彙数)
  • 類似度から見えてくるコレクションの関係を分析.
  • 今後は,分類知識の修正や更新の仕組みや,具体的な横断検索の仕組みを検討.

東博公開研修会「ミュージアム情報の制作・管理・活用」

東京国立博物館の公開研修会「ミュージアム情報の制作・管理・活用」に行って来ました.

閉会の挨拶で,地味なタイトルながら非常に骨太な議論ができたのでは,みたいなことを聞き,まさにその通りだと実感しました.

以下,参加レポです.

※レポはryojin3の所感であり,講演者の意見・意図が100%反映されているとは限りません!その点ご注意くださいませ.



基調講演
  • 題目:情報で活きるミュージアム
  • 発表者:笠羽晴夫氏(財団法人デジタルコンテンツ協会 研究主幹)


1.デジタルアーカイブの歴史
  • 1990年代初頭の電子博物館・電子美術館・電子図書館とマルチメディアの話から,現在のネットワーク環境での情報蓄積公開についての概論.
2.これからのデジタルアーカイブ





報告
  • 題目:ミュージアム情報と学芸業務
  • 発表者:村田良二氏(東京国立博物館 情報課 研究員)

1.資料DBと学芸業務について
  • 学芸業務において,資料DBはその根幹をなすDB.ところが,DBのデータ入力の難しさは以下のデータが物語っている.
  • 平成19年の文化庁調査によれば,公立博物館の所蔵資料と学芸員数の中央値は6000点/3人.更に細かく分類すると,以下のようになる.
    • 総合博物館 30000点/5人
    • 歴史系博物館 12000点/4人
    • 美術館 1626点/3人
  • また,常設展の展示の平均値は以下のようになる.
    • 総合博物館 1000点
    • 歴史系博物館 446点
    • 美術館 275点
  • 作品に係る学芸系業務
    • 受け入れ,調査研究,展示,修理,貸借等.
  • 相補的関係
    • 収蔵品DB→データ活用→業務がスムースに進行する.
    • 業務中→記録の蓄積→収蔵品DBが豊かになる.
  • 収蔵品DBの問題
    • 「古い貧弱なデータ」は「使われない」→悪循環.
  • 収蔵品DBの活用
    • 「最新の充実したデータ」は「積極的活用」される→好循環.
    • 定型的作業の軽減=システムを使うと楽になる!はインセンティブ.
    • コピペを減らす.
    • 予定履歴管理は作品ごと,時期ごと,展示室ごと,,など様々な角度から見たいので,,,一元管理.
2.業務プロセスの分析
  • 具体的に収蔵品DBを活用するためには業務プロセス分析が重要.
  • ラフなBPM(Business Process Modeling)の活用.
    • 共通要素
      • 期間,場所,関係者 → 全て収蔵品DBに関連する.
    • 計画の進行
      • 計画から変更や破棄まで含めた業務のライフサイクルの把握.
  • 共通要素(現在取り組んでいるもの)
    • 一覧と検索
    • リスト編集
    • プロセス管理
    • 定型文書出力
    • これらを実装したシステムのデモ
3.システム構築の実際
  • インセンティブがないと,利用者は使わない.
  • 段階的な構築が大事.
    • 無理のない移行(慣習の尊重,学習障壁の低減)
    • 身近な(適切な)目的設定(期待感)
  • 技術的課題
    • モジュール化→APIの公開とか,Webサービス or SOA→他館との連携等.
    • URLの適切な利用.
    • データ参照はgetをもっと活用すべき.





報告
  • 題目:デジタル画像情報の基礎
  • 発表者:鈴木卓治氏(国立歴史民俗博物館 准教授)
1.画像の基本
  • 画像の基本的な話.
  • 最近は光の定義として,sRGBが一般的らしい.
  • よく記録媒体の寿命が議論されているが,フォーマットの寿命のほうが致命的で大問題だ.
2.デジカメの基本
  • デジカメのCF配列は,RGBかCMYが基本.
3.おまけ
  • マクベスのカラーチャートはいい.
# 他にももっと有益なことを話されていた気がしたが,メモし忘れました...




報告
  • 題目:デジタル情報管理の実務
  • 発表者:田良島哲氏(東京国立博物館 情報管理室長)

1.博物館にある非デジタル情報
  • テキスト:調書,台帳・目録,解説文・ニュースレター,紀要・報告書・図録.
  • 静止画:写真,図面・スケッチ.
  • 動画:映画フィルム・ビデオテープ.
  • 音声:オーディオテープ・レコード.
2.デジタル化のメリット
  • 処理の早さ.
  • 迅速・柔軟な検索→新たな視点による発見.
  • 蓄積が容易.
  • 流通の簡便さ.
  • 利用範囲の広さ
3.ネットワーク化のメリット
  • 情報の流通と共有が進む.
    • 情報が多くの目で評価される.新しい発見.
  • コミュニケーション環境が改善.
    • むだな連絡調整の削減.
    • 事務処理の迅速化.
    • 新たな出会い(人-人,人-モノ,モノ-モノ).
4.何故活用されない?
  • 素材が供給されない.
    • ミュージアム側の人・資金不足,技術支援がない.
  • 制作者の層の薄さ・知的力量不足.
    • 素材(文化遺産)の知名度頼り,素材の切り貼りに終わる例,コンテンツとしての魅力に欠ける.
  • 需要が起こらない(選好の対象外).
5.デジタル情報作成の基本
  • 真正性がある.
    • データの根拠を明確に.
  • 長く使える.
    • 汎用的なデータ形式,非依存.
  • できるだけたくさん.
    • 利用には品揃えが大事.
6.データ本位の情報蓄積
  • 技術に振り回されない.標準的なもの.
7.何をすればいいか
  • 手持ちの資産の棚卸し.
    • 使えるかどうかの水準把握,メタデータの把握.著作権,肖像権,パブリシティ権.
  • 機会を逃さず.
    • 予算が付いたら.
    • アプリ依存データ,事業に必要な部分的データにしか作らない(=情報の陳腐化),はダメ.
  • 日常的に.
    • 業務の中でデジタルデータ作成を組み込む.作らざるを得ない or インセンティブ.
    • 入力には知識が必要.
8.東博の事例
  • 受け入れ時に撮影(研究員)→ネット+DB→情報課で管理.





報告
  • 題目:ミュージアム・ウェブサイトの運用
  • 発表者:小林徹氏(東京国立博物館 広報室 主任)

1.東博のウェブサイトについて





報告
  • 題目:「イメージアーカイブ事業」の展開
  • 発表者:手嶋毅氏(株式会社DNPアーカイブ・コム 常務取締役)
1.DNPアーカイブコムとは
  • DNPアーカイブコムのデジタルアーカイブ
  • デジタル化は,フィルムから起こすのと,デジカメ撮影と2パターンある.
2.エージェンシーの公共/営業サービス
  • 公共的な立場として
    • 収蔵品の目録DB作成,広く無料で情報提供,国の文化資産の記録.
  • 営業的な立場として
    • 上記を達成するための資金獲得,出版社への提供,世界的に事業/技術的に優位な立場を確保.
3.欧米市場
4.その他
  • 東博イメージアーカイブは,利用形態や利用量に応じて様々な課金をする.
  • 権利のクリアランスが重要.
  • イメージを用いた様々な事業展開も行っている.





報告
  • 題目:アーカイブデータから公開コンテンツへ
  • 発表者:山崎千代乃氏(凸版印刷株式会社 文化事業推進本部デジタルコンテンツ部 課長)

1.情報の公開と利用
  • 印刷,DB+検索システム,閲覧システム,Web,メディア
  • 誰に何を何故伝えるか,で変わってくる
2.VR
  • 利点
    • 可視化,仮想体験(遺跡とか行けない場所とか)復元
    • 再現(欠損や当時の状況.データに根ざして)
3.凸版印刷のVR事業
4.TNM & TOPPAN ミュージアムシアター
最後のほうは疲れてしまってメモもだんだん適当に...




質疑
  • 東博の業務システムのコードは公開する?
    • 将来的には.まずは,業務の一般化モデル作りたい(どこかと共同研究).
  • APIのような形で公開する?
    • そのうち.前向きです.
  • 学芸員の展覧会用のtmpDBみたいなものは付けられる?
    • システムに収蔵品をまとめるリスト機能がある.これを拡張する必要がある.
  • これからのシステムはブラウザベースなの?
    • ユーザにとっては楽.外部公開でも応用できる.世の中の流れ.ただ,ブラウザはデメリットもあるので,場合によってはクライアントソフトを作る.
  • 東博はNDLの近代デジタルライブラリみたいな公開はするの?
    • 検討中.古典籍が数万のオーダーであり,かつマイクロフィルムがなくなりそうなので,デジタル化作業とインターフェースの検討中.
  • 田良島さんの発表のデジタル化で「たくさん作る」ってどういう意味?
    • モノの数が大事.利用者の選択の幅は広いほうが良い,という意味.メタデータも太っているほうがいいが,これは作るのが大変.





ここにまとめるだけでも相当時間を要しました.それだけ,議論の中身のある研修会だったのではないでしょうか.