研究記録のアーカイブズ

日本アーカイブズ学会 国文学研究資料館アーカイブズ研究系研究プロジェクト 「研究記録のアーカイブズ ―研究過程の検証と新たな情報資源化のために―」に参加してきました.

今回は場所が自宅に近いということもあり,ゆるゆるとお昼を食べてからの出陣でした.多摩都市モノレール・高松駅付近は誘致も進めているのでしょうか,国の研究機関が多く今後発展しそうな雰囲気のある場所でした.
  • 日時
    • 2009年2月21日(土)13:30-17:00
  • 場所
    • 人間文化研究機構国文学研究資料館 2F 大会議室
  • 参加
    • 4~50名
まずは事務局から主旨説明
  • 研究過程アーカイブの重要性
    • 過程を明確にすることによる,研究の不正防止
    • 過程を明確にすることによる,研究の説明責任
    • 過程アーカイブからの新たなテーマ創出
  • 今回は,社会科学・自然科学・人文科学それぞれの「研究過程アーカイブ」について議論

1. 実証的社会科学研究とデータアーカイブの役割
  • 主旨
    • 社会調査におけるマイクロデータのデータアーカイブの話
      • マイクロデータとは,社会調査時の集計前のデータ.コンピュータ処理が可能なもの
  • 目的
    • マイクロデータのアーカイブ化・共通利用化
    • 仮説検証プロセスの明確化
    • 検証時間の短縮
    • 若手・海外研究者向けとしても活用
  • 背景
    • 日本ではマイクロデータの2次利用はあまり広がっていない
      • マスコミ等の企業は非公開にしたがる
      • 調査会社は契約上公開できない場合がある
      • 近年では個人レベル・特定分野で公開が広がってきている
    • 統計法の改正(2009.04.01~)も検討要素
  • SSJデータアーカイブ
    • 対象データ
      • 統計法でカバーされない,民間/政府寄託の調査データ
    • アーカイブのメリット
      • 長期保存(データを散在させない)
      • メタデータ管理(調査データの活用促進)
      • フィードバック(利用状況の把握と新規研究テーマの発見)
    • 仕組み
      • SSJDA(Social Science Japan Data Archive)が窓口
      • 各研究機関からデータを寄託してもらい,SSJDAが整形保存,利用者の申請に応じてネット提供.2次利用の結果(論文等)は寄託者にフィードバックする
    • データの受け入れ
      • フォーマットは様々だが,SPSS等で利用できるように変換保存する
      • 個人情報は秘匿処理を行う
  • 海外との比較
    • 欧州ではこの手のDBは作りが同じで,横断利用が容易にできる
    • 海外のDBは利用料は高いが,大きな組織単位で加盟するので研究者負担は少ない
    • 海外にはデータ整理を専門とするデータライブラリアンがいる
  • 運営上の課題
    • データ整理の専門職不足
    • 予算が足りない
    • アーカイブデータは寄託者の善意で成り立っている(提供が少ない)

2. 自然科学の研究記録のアーカイブ
  • 自然科学系の研究記録について,定義・発生・利用等を網羅的に解説
  • 研究記録の定義
    • 社会的意義や思考の記録といったことも言っておられましたが,一番はやはり「実験・観測データ」?
  • 研究記録はどんなところで発生するか
    • 研究の現場:準備活動時・研究実施時・研究の総括/評価時
    • 機関と個人:機関の公的記録・プライベートなメモ 等
  • 利用
    • 記録が参照されるのは検証時
      • 科学の発達過程の検証
      • 組織や制度の正当性の検証 等
  • 問題点
    • アナログとデジタルの実験・観測データはそれぞれアーカイブ手法が異なる
    • 実験・観測データアーカイブから検証可能な状態に持っていく環境の整備が不十分
  • アーカイブの重要性
    • 大規模な実験を必要とする自然科学では,実験条件が複雑なため背景やデータ処理手法が詳細にわからないと追試しづらい.それを明確に示す過程アーカイブは必要

3. 旧史料館レコーズの整理と公開について
  • 早めにオリオン書房に行きたかったので,ご講演が始まる前の休み時間に失礼しちゃいました.なので,メモはなしです(^^;
  • 頂いた資料によると,「旧史料館レコーズ」と呼ばれる,国文学研究資料館附置史料館の文書記録の目録化と公開の経緯についてご講演があったようです.

考察
さて,今回は後半サボってしまったので,簡単に.

今回,3件中2件のお話を聞くことができました.研究プロセスも含めたアーカイブは,前向きに捉えれば至極当然・今後の2次利用を考えると重要なことかと思います.その反面,アーカイブ作業に時間やお金がかかるというのは本末転倒だと思います.

もちろんアーカイブ研究者にとってはアーカイブするという行為そのものが研究対象ですが,それ以外の専門家にとって,過程のアーカイブ作業はあくまで小コストでベストな効果が挙げられなければならない.これは別に研究に限ったではなく,仕事をしている人も,勉強をしている人も皆が考えることです.昨今lifehack等が取り上げられるのも根底にはそのような考えがあることは否めないでしょう.

そう考えると,過程アーカイブとは,いかに気にせずに大量の作業内容がアーカイブされ,かつ利用可能な状態に整理されるかを追及することがミソになるのだと思います.Lifelog研究やWebアーカイブ研究等,大量データから意味のあるデータを汲み取って整理する研究分野を Watch していくことも重要なのでしょうね.

戦後の記録映画を残せ

記録映画保存センターのブログで紹介されていましたが,2/21(土)のNHKおはよう日本で記録映画の保存について小特集がありました.

7:35から10分程度だったわけですが,土曜日の朝早くに起きられるわけもなく(!?),録画しておいたものをゆっくり見させて頂きました^^

以下,簡単なメモです.

記録映画とは
当時の世相を伝える貴重なもの.例えば,以下等.
  • 佐久間ダム総集編(1958) → 戦後の経済復興を伝える
  • 水俣 ~患者さんとその世界(1971) → 公害の姿を伝える
現状
横浜のフィルム現像会社を例に,記録映画保存の現状が紹介されました.フィルム現像会社では,映画制作会社のフィルム原版を保管しています.しかし,管理のためのスポンサーが付かず,現状原版は放置されている場合が多いようです.このような放置原版は国内に約5万本,うち30%は記録映画だとされています.

問題点
基本的に放置なので,フィルムの保存状態が悪く,劣化する例が多く見受けられるそうです.例えば,高温・高湿度のためフィルムにシワが寄ってしまったり,フィルム同士がくっついて塊のようになってしまう場合があります.

これらの問題に対し,現像会社でも何らかの手を打ちたいところだそうですが,所有者の許可なく修復保存・廃棄・もちろん二次利用もダメで,対策が打てないのだそうです.

取り組み
そこで,国立近代美術館フィルムセンター 相模原分館では,後世に伝える貴重な記録映画の収集を行うため,所有者の確定と同意を取る作業を続けています.フィルムセンターでは,気温5度,湿度40%を保ち,フィルムが500年は耐えうる保存環境が整っているそうです.

また,記録映画保存センターの村山英世氏が中心となり,記録映画アーカイブプロジェクトも立ち上がっています.氏曰く,このプロジェクトは個人やプロダクションが保管管理する記録映画を公共・国民のものにするためのプロジェクトだそうで,まず第一弾として,日立製作所が持つ「岩波映画製作所」フィルム原版群のアーカイブプロジェクトが企画されています.岩波映画製作所は平成10年に倒産しましたが,これまでに4000本・1億フレームにのぼる映画が残されています.代表的なものには,「雪の結晶(1953)」,「教室の子供たち(1954)」等があります.

センターでは,これらのフィルムから所有者を探し出し,寄贈依頼を行うという地道な活動を続けており,これまでに80%程度は寄贈に同意を得られたそうです.

村山氏は,最終的にはアメリカの「映画保存法」のような仕組みを作らないと解決できないと考えています.持ち主が現れない場合は国に寄贈するという仕組みが作られれば,現像会社で朽ち果てるのをただ待つだけのフィルムが蘇るのかもしれません.

プロジェクトには,映画監督の羽仁進氏も参加されたようで,「フィルムにはその時代でないと記されないものがある.そのため記録映画の見直しには意味がある」旨,語られていました.

活用の取り組み
フィルム・アーカイブはフィルムを保存するのみならず,それを活用する環境ができて初めてフィルム・アーカイブと呼べます.番組では,以下の2つの事例を通して活用に向けた取り組みが紹介されていました.
  • 台東区忍岡中での理科授業
    • 理科の授業で50年前の科学映画を活用.映画自体の質がいいので効果的.科学法則は原則変わらないので古くても使える.
  • デイサービス施設での記録映画上映
    • 高齢者に古い記録映画を上映し,古い映像を通して思い出を語り合ってもらう.
    • 記憶を呼び覚ましてもらうことで認知症予防等に活用.
所感
短い特集でしたが,さすがNHK,内容がまとまっており現状の問題点と取り組みがよくわかりました.ryojin3的にはフィルムをアーカイブするうえで欠かせない(はずの)デジタル処理についても紹介があると面白かったのになぁという感想です.また,NHKでは川口で大々的にアーカイブの取り組みをやられているので,そことの関係や連携(あるのかな)等も知りたかったところです.

Europeana徹底解剖

昨年末,公開と同時にアクセス過多で一旦サービスを停止するという事態に陥った欧州デジタル図書館「Europeana」.サービスが再開して2ヶ月近くが経ちました.そろそろシステム的にも利用状況も安定してきたのではないかと思い,ちょっといろいろ調べてみました.今回はそのまとめです.

■経緯
以下は,Current Awareness PortalITMediaCNET Japanから拾って時系列に並べたニュース記事です.網羅的に集めたつもりですが,検索漏れがあるやもしれません^^

2005年
2006年2007年2008年
■協力組織
2009.02.15現在,108機関.まぁこう見ると意外と少なく感じますが,国の代表(National representatives)には各国を代表する図書館等が名を連ねています.
  • Archives 12件
  • Audio-visual collections 7件
  • Cross-domain associations 12件
  • Libraries 14件
  • Museums 11件
  • National representatives 26件
  • Other 2件
  • Project Contributors 12件
  • Research institutions 12件

■言語

ヨーロッパ中心の25ヶ国語にI18Nされています.
  • Catalan
  • Bulgarian (bul)
  • Czech (cze/cse)
  • Danish (dan)
  • Dutch (dut)
  • English (eng)
  • Estonian (est)
  • Finnish (fin)
  • French (fre)
  • German (deu)
  • Greek (ell/gre)
  • Hungarian (hun)
  • Icelandic (ice)
  • Irish (gle)
  • Italian (ita)
  • Latvian (lav)
  • Lithuanian (lit)
  • Norwegian (nor)
  • Polish (pol)
  • Portuguese (por)
  • Romanian (rom)
  • Slovak (slo)
  • Slovenian (slv)
  • Spanish (esp)
  • Swedish (sve/swe)

■機能

  • 検索
検索窓1つのGoogle方式.Advanced searchを選択すると,(「Any fields」,「Title」,「Creator」,「Date」,「Subject」)×3を(AND/OR)で検索できます.
  • My Europeana
登録ユーザの検索結果の保存,タグ付与,友達への紹介,等ができるらしいが,まだ登録も利用もできないようです.
こちらもデモがあるのみ.コンテンツの共有や再利用についてのアイデアを議論する場としてCommunitiesが用意されるようです.デモを見てみると,SNSのような運用を想定しているようです.
下側に作品の多さに比例して大きさの異なる西暦が並び,各西暦をクリックすると上側に作品が出てきます.上側に出てくる作品は横スクロールバーの動きに合わせてブワーっとフローして行きます.iPhoneのマルチタッチに近い動きか.驚いたのは,普通こういうのってFlashで作ると思うんだけど,全部JavaScript!なんとも….まだまだベータ版らしく,左側の検索窓から西暦を入れて検索すると,検索結果の西暦は大きさが変わらなかったりしますが,まぁご愛嬌.
実験的ラボ.大学や研究機関,コンテンツプロバイダと協力し,Europeanaの持つコンテンツを素材に実験的な機能を試していこうというラボです.今のところ,プロトタイプのSemantic Searchが公開されています.MultimediaN N9C Eculture projectThe ClioPatria semantic search web-serverで動いているようです.これについてはEuropeanaのSemantic Searchのインターフェースも含め,別にもっと詳しく調べたいと思っています.

■コンテンツ

  • 概要
Europeanaは検索の窓口です.検索結果のサムネイルはEuropeanaのイメージサーバにキャッシュされているようですが,コンテンツ本体は参加機関のサーバから再生されます.従って,全てのコンテンツに関するコントロールと権利保持は各参加機関で行うことができます.
  • 資料件数
約200万件
  • フォーマット
フィルム,写真,絵画,音楽,地図,原稿,書籍,新聞,etc.
  • 将来的な話
2010年までに現在の200万点から,1000万点アイテムの完全公開を目指すそうです.そのため,実際にEUはデジタル化資金を拠出しています(Current Awareness Portal,2008.12.04).また,今はコンテンツの登録を文化組織に限定していますが,将来的には個人の所蔵等も登録公開できるような仕組みを作って,コンテンツの幅を持たせたいようです(INTERNET Watch,2008.11.21).

■相互運用性
詳細はEuropeana/EDLnet conference: Users expect the interoperableにあります.


■メタデータ

基本的にはQDC(The Qualified Dublin Core)のようですが,一部拡張もされています.詳細な仕様はMetadata elements in the Europeana prototype(pdf)にあります.

拡張エレメント
  • <dc:relation>のサブプロパティとして<europeana:isshownby>
  • <dc:relation>のサブプロパティとして<europeana:isshownat>
  • <europeana:usertag>

■閲覧

せっかくなので実際に有名なコンテンツを見てみました

いやぁ,全然徹底解剖してないけど,疲れちゃった.今日はこれくらいで.次は今回息切れが著しい相互運用性やメタデータ,セマンティック関連を中心に調べたいと思っています.てか,むしろそっちが専門に近いだろうに….

近代化産業遺産とアノテーション

地域コミュニティサイト「Lococom」"近代化産業遺産"特集サイトができたようです.
近代化産業遺産とは,経済産業省が認定する文化遺産群のことで,日本の産業近代化に貢献した建物や機器類の保存活用を目的としています.2007年度には,地域史・産業史を軸とした33のストーリーとそれに関連する575件の産業遺産が認定されています.
今回は経産省の「地域経済産業活性化対策調査」事業の一環で,Lococomを運営する株式会社ネクストが受託開発を行ったようです.そこでは,以下のような効果が期待されています.
  • コンテンツ掲載による,広範囲な近代化産業遺産の認知
  • 地元からの情報発信とクチコミ化による地域の活性化
現在は検証フェーズのようで,情報提供やクチコミを行うことの有効性・ビジネスモデルについて検討が行われているようです.

また,サイトにはモデル地域の特集ページも用意されています.群馬県桐生市をモデルに,近代化産業遺産コンテンツの提供のほか,商工会議所等と連携した観光情報(宿泊,飲食,施設,イベント情報等)が提供されています.

経産省のサイトから産業遺産のリストを入手できますが,せっかくなのでLococomの特集ページを使ってどのような遺産があるのか見てみたいと思います.特集ページではLococomが持つ機能(遺産の検索・閲覧・クチコミ投稿・クチコミ閲覧等)がそのまま使えるようになっています.

主な近代化産業遺産(順不同,ryojin3の興味順)
経産省では2008年度も引き続き前年度と異なる分野で「近代化産業遺産群 続33」として認定を行っており,こちらもLococomで公開予定だそうです.また,ネクストの受託は2009年3月末までですが,コンテンツは4月以降も掲載するそうです.これら一連の動きは,経済産業省 経済産業政策局の活用委員会の議事(ページの一番下)を参照することで詳細情報が得られます.

さて.このような事例は,文化遺産情報にアノテーションを活用する好例なのではないでしょうか.

あるデータに対し,注釈データ(メタデータ)を付与することをアノテーションと言います.Java使いならご存知,クラスやメソッドに入れる,アレです.エラーチェックや加工はしませんし,「注釈」は定義が広いので一概には言えませんが,遺産情報(あるデータ)に対するクチコミ(注釈データ)はアノテーションの一種と考えられます.

アノテーションについては様々な研究が行われているようです.以下はざっと調べた一部分です.他にもたくさんやられてそうです.

消費者生成メディア,いわゆるCGMが取り入れられているeコマースサイトでは,アノテーション,つまりクチコミは商品情報同様にサイトの中心的なデータになりつつあるようです.

クチコミは売りたい側の意図を反映しない純粋な消費者の声であり,確度の高いマーケティング情報源としてここ数年その収集方法や解析方法を中心に注目を集めています.

遺産情報に対するクチコミは,eコマースサイトにおけるクチコミのように直接商品にフィードバックがかかる類のものではありませんが,それなりに重要な意味を持つかと思います.なぜなら,クチコミは観光情報として活用できるからです.

観光情報として活用が見込まれるということは,平たく言えば地域の経済活性化につながる呼び水になりうる,ということを意味します.恐らく用意されているシナリオは(こんなに単純ではないでしょうが),サイトに地元情報を発信→サイト閲覧による観光客の獲得→観光客のクチコミ書き込み→クチコミ情報を閲覧した更なる観光客の獲得,,,のような感じでしょうか.

実際には,サイト自体の周知(SEO,宣伝/広告),クチコミを増やす方策(その遺産のぬしとなるような人を(お金を払って)サイト側で育てる等),地域情報のこまめなアップデート,他の類似サイト(旅行サイトや地図サイト)との差別化,等など,考えなければならない点が山ほどあるでしょう.

また,集計やマイニングのことも考え,クチコミをGDAのようなXML形式のアノテーションで集めておくことも大事かと思います.クチコミからの知識発見にはXMLのようなデータ表現は役立ちそうです.

最後に.どうでもいいことですが,このサービスで残念なのは遺産のページから貼られている「公式ページ」へのリンク.これ,順次入れ替えて行くんだろうけど,今のところどの遺産を見ても経産省のページにリンクが貼られています…orz

Google Earth

新しく入れたGoogle Earthが楽しくて,いろいろいじっていました.

先日のプラド美術館は KML + Google SketchUp + αで作られているようです.

Google Earthはリリースされて時間が経っていますので既にご存知の方も多いでしょうが,ちょっと説明.

KML(Keyhole Markup Language)とは,Google EarthやGoogleマップ上に地理的な情報(目印とか,地名とか)を配置するためのXMLボキャブラリのことです.2008年にはOpenGIS KML Encoding Standardとして,OGC(Open Geospatial Consortium)標準となっています.

また,Google SketchUpとは3Dモデリングシステムのことです.SketchUpには利用可能なデータ形式にKMLやKMZ(KMLを圧縮した形式)があり,写真からモデルを起こす機能もありますので,恐らく,プラドは写真をSketchUpで3Dに起こし,KML化してGoogle Earthに登録しているのでしょう.

+αと書いたのは,Earth上のプラド美術館モデルには,画像一覧が出てきたり,画像の詳細が閲覧できる部分があることを指しています.ここはどうやって作っているのかわかりませんが,スクリプト言語とKMLの画像指定(href,NetworkLink等),SketchUpの写真貼り込み機能あたりを組み合わせて作ってるんでしょうかね.

せっかくなので,プラドをブラウザに埋め込んでみました.表示するにはブラウザ用プラグインが必要です.

Google earthでプラド美術館

Google Earthでスペイン・プラド美術館の超高解像度写真が閲覧できるレイヤーが出ました.

主なリソース


今まで使っていたマシンは非力でGoogle Earthがうまく動かなかったので保留してたのですが,そこそこハイスペックなマシンを手に入れたので,早速試してみました.

まずはGoogle Earthをインストール.最近はGoogle Updaterという統合管理ツール?でGoogle関係のソフトは管理されてるんですね.残念ながら,自分の環境ではUpdaterがうまく動かず,個別にDLしましたが….

まずは左下の「レイヤ」の「建物の3D表示」にチェックを入れ,ジャンプで「プラド美術館」を検索します.



お,プラド美術館のところがセカンドライフチックになってます.少しずらして見てみます.



プラド美術館上でクリックすると,一瞬建物が青くなって,Masterpieces(画像一覧)が出てきました.現在は全部で14点が掲載されているようです.



せっかくなので「三美神(The Three Graces)」を選択.画像とメタデータが表示されました.解説文も付いており,下側「Continue reading」から詳細な解説を読むこともできます.



メタデータはこんな感じ.

 Author: Rubens, Peter Paul
 Catalog n. P01670
 Technique / Support: Oil / Wooden Panel
 Dimensions: H. 221 CM W. 181 CM
 Date: Ca. 1635
 Subject: Mythology. Gods
 Provenance: Royal Collection
 School: Flemish
 Object type: Painting
 Displayed in: Villanueva Building - Room 9 (On Show)

邪魔なのでサイドバーを消してから更に細かく見てみます.よく見ると,画像の下に「Browse this picture in ultra high resolution (the world largest pictures)」というリンクがあります.the world largest picture ですか.スゴイ.14G pixelらしいです.

で,これを選択すると,ググっと画面が動き,建物内部に入っていきます.そこでは背景が深い青になり,画像のみが表示されます.右上にマウスポインタを動かすと,写真を拡大縮小できる操作メニューが現れます.



操作メニューでは,画像全体のどこをフォーカスしているのかがわかりつつもどんどん拡大や縮小ができます.写真は拡大してみたところ.まだまだいけそうなので,最大限拡大してみました.



MAX拡大.右側の女性の髪の毛あたりです.さすがにMAXにするとボンヤリしていますが,絵画のひび割れ等細部を見ることができました.



画像を堪能したので,右上の「写真を終了」ボタンで美術館を抜けます.



え...ここに飛ばされるのか...どうせなら画像一覧に戻ればいいのに.ここからまた画像一覧に戻るのが面倒です.ま,これはryojin3がGoogle Earthの操作に慣れていないせいもあるだろうケド...



ここらへんまで引いて,建物か「MUSEO NACIONAL DEL PRADO」と書いてある白いアイコンをクリックすれば
再び画像一覧に行くことができます.

と,まぁここまでが一連の閲覧手順です.

以下,ryojin3の所感です.

今回の試みはどういう意図があったのでしょうか.プラド美術館の場合,2つの特徴が見受けられます.つまり,1) 超高精細画像の公開,2) ユーザアクセスが簡便なプラットフォームの活用,です.

前者は14G pixelと桁違いに大きな画像をよりセキュア(Google Earthがセキュアであるかどうかは本質的な議論ではありませんが,少なくともWebにポンと出すよりかはセキュアであると考えられます)な環境で見せている点が特徴的です.もちろん用途として閲覧のみならず美術研究の促進も考えられます.また,後者に関してはそのようなコンテンツをただ自館のサイトにアップするだけでなく,Google Earthというそれなりに人が利用しているプラットフォームを用いることでニュース性や露出度の高さ,Google Earthの持つ機能を利用できる点が特徴的です.

現状,プラド美術館の外装は昔のウォークスルー型仮想美術館のようですし,操作もそれなりに面倒です.しかし,絵画コンテンツの増加と操作性やユーザインターフェースが向上すれば,美術研究のみならず,教育用コンテンツとしてどんどん活用されていく気がしますし,プラド×Googleもそれを狙っているのではないでしょうか.

今回試した環境はたまたまリリース直後のGoogle Earth 5.0 betaでした.海中や火星の探索,タイムスライダーによる過去の画像閲覧が可能になっているバージョンです.このようなコンテンツと機能の充実ぶりに,ryojin3は,美術作品のみならず,自然科学,歴史学,その他様々な教育用コンテンツは地理情報やタイムラインと紐付きながらGoogle Earthに集約されていき,教育用プラットフォームとして活用されていく可能性を感じました.