かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

パネルディスカッション「クラウド時代の機関リポジトリ」(国立情報学研究所平成22年度CSI委託事業報告交流会参加記録 part 4)


昨日*1に引き続き、、国立情報学研究所で開催されたCSI委託事業報告交流会の参加記録です。

最先端学術情報基盤(CSI)構築推進委託事業として、各機関が平成22年度に実施した研究開発及び調査等の結果について情報共有を図るとともに、その成果をCSI構築のために活用する方策等を検討するイベントです。

大学等図書館関係者、学会関係者、出版関係者以外のお申し込みは、お断りさせていただきますのであらかじめご了承ください。


2日目の今日は午前中いっぱいをかけて、5人のパネリストの方々を招いてのディスカッション「クラウド時代の機関リポジトリ」が開催されました。
お1人10分程度ずつのプレゼンテーションに続いて、1時間20分以上のディスカッションの時間が設けられたのですが、ほとんど途切れることなく発言が続いた盛り上がりっぷりです。
注目は国立情報学研究所が運用を予定しているクラウド型の「共用リポジトリ」と、それにまつわる様々の話、それに機関リポジトリコンテンツのバックアップを如何にとるか・・・というところに絡んでNDLのWebアーカイブ事業/電子化事業の話も!


ということで以下、当日の記録です。
一連のエントリでおそらく4回目くらいの定型文ですが、あくまでmin2-flyが聞き取れた/理解できた/書き取れた範囲での内容となっておりますので、ご利用の際はその点ご容赦願います。
誤字脱字、事実誤認等お気づきの点があれば、コメント欄等を通じてご指摘いただければ幸いです。



コーディネータ:逸村裕先生(筑波大学教授)
パネリスト:
  • 逸村先生:はじめに1人ずつご報告をいただき、その後、フロアも混じえてディスカッションとする。

「図書館とデジタル・プリザーベーション:その後」(竹内先生)

  • 事前に打ち合わせをしたが、合意したのは「筋書きのないドラマになる」こと
    • さまざまな問題の議論がされることが大事
  • 今日の話・・・
    • 背景
    • プリザーベーションの必要性
    • 東日本大震災のような場合に対応できるのか?
    • プリザーベーションとクラウド
  • 背景:
    • 2005.9に「機関リポジトリとデジタル・プリザーベーション」というタイトルで千葉大学の機関リポジトリ公開記念シンポジウムで発表
      • 機関リポジトリによって説明責任を果たすためにはプリザーベーションが必要になる
      • 「プリザーベーションを考えると機関リポジトリの進展が遅れる?」・・・コンテンツを集めるだけでなく永続的アクセスの仕掛けが要る
      • 3.11のようなことを考えると、考えておかなければいけなかった問題である
    • 「機関リポジトリ」モデル・・・学外への情報発信窓口として図書館が機能するようになること
      • 学外コンテンツを内部へ⇒大学生産コンテンツを学外へ出す機能へ
      • 他には入手できない情報の蓄積が行われている
      • 教員個人ページなどではなく機関がやる意味・・・永続性/安定性/メタデータ等の付加価値
      • 永続性保証=プリザーベーション。リポジトリとプリザーベーションは表裏一体
  • デジタル・プリザーベーション
    • 電子情報の保存・・・紙媒体よりも厄介
      • 媒体保存≠中身の保存
      • 記録された情報が残っていても再生できなければ無意味
      • 紙のように偶然残ることは期待できない
    • なにをしなければいけないか?
      • 計画の策定
      • 技術の適用
      • 保存用のメタデータスキーム/履歴
        • いくつかのモデルはある・・・PREMISなど。
    • 現時点での問題:
      • 機関としてどういう保存方針を持つのか、の明確化
        • 図書館だけの問題ではない
        • 大学において電子的に生産される様々な情報を大学は保存しているのか? データはあるのか?
        • それがないと大学運営が回らない可能性すらあるが・・・誰が/どういう方針でやるのか?
        • コーネル大学では2004年に図書館が大学文書館機能を果たすことについてのframeworkが作られている
          • 学術的内容+機関として残すべきもの+法的義務のあるものを大学関与のもとで保存する
          • しかしこの作業を行うためのポストは後になくなっている。その後の展開は未フォロー
      • 決定的技術がない?
      • 経費/人的資源の確保
  • 東日本大震災とその後の計画停電の影響
    • 停電になればサーバは使えない
      • 計画停電・・・電源オン・オフが頻繁化。サーバが耐えられなくなりwebサービスを停止
      • ネットワークが使えない・・・何年か前の世界のよう。サーバに問題がなくても対応不能
      • データが保存できるだけでは何も出来ない
      • あらかじめなにをどこまでするか決めておくことが重要
  • 逸村先生:補足。マイグレーション/エミュレーションという語がでてきたが(メモにはないけど出てきたのです)、マイグレーション=データそのものを新しいものに置き換えること。エミュレーション=古いデータを読める環境の用意。

クラウド時代での図書館業務とリポジトリ」(入江さん)

  • 昨日のセッションから思うこと:
    • 今の機関リポジトリは図書館業務の一部。機関リポジトリだけの話をしても、それだけでは済まないところがある
    • 図書館業務としての整理が必要。紙と電子の関係は大きい
      • まだまだ紙の影響力は大きい。大学に帰れば紙を切る話をするのだがここでは紙を守る立場
      • これまでの図書館リソースを継続的に発展させるには。これまでの資産、catなどをリポジトリにどう絡めるか?
      • 学位論文などは電子で出てくるものをどう保存するのか、それを紙とどう絡めるのか
      • 遺跡発掘資料は慶應でも大きな問題。年度末に何十箱も来て整理するのが大変。読めない。とった目録に意味があるかもいつも疑問
    • 紙のためのコストをどう電子のコストに変えるか? そこでどう図書館の体制を変えるか?
      • 慶應では年間8万冊の本を受け入れ・目録作成。コストがかかる。本当に必要があるのか+どう電子を絡めるのか?
  • 補足:相互運用性とURI
    • Google Books IDによるStatic Link:
      • ISBN
      • LCCN(LC番号)
      • OCLC
      • 慶應BOOKID・・・日本の古いものは慶應のバーコードの番号がふられている。それしか使えるものがない
    • これら全体のURIをどうする?
  • 運用はしっかりとしたサーバで
    • リポジトリ発足当初・・・「10万円でサーバできた」というような話が多かった
      • データが増えたら継続とデータ保存のためにしっかりとしたサーバ経費をかけよう
      • 慶應も出来ればデータセンターへ移したい
      • 震災でわかること・・・港区は守られても日吉は守られない(計画停電のこと?)。
  • 本題:慶應の目録・メターでフロー リポジトリ体制の変更
    • 2年前に紙と電子のバックヤードを完全に切り離した
      • 紙資料についてどれだけコストを削減するのか
    • 電子用の組織の中にリポジトリの組織機能も融合
      • 通常はMARC購入でデータを作るのだが、リポジトリに入れるものは目録部隊で作る
      • 当初・・・リポジトリのデータを作るコストはそれほどなかった/今は増えているのでコストが増えている。その分紙の目録部隊を減らして持ってきている
  • リポジトリにとって大事なのはコミュニティとデータ
    • システムはそれはそれでどうでもいい
    • クラウドは集中するほど影響力は大きい
    • システムは変わっていくもの
      • 別にどうでもいいんじゃないか?
      • システムがコミュニティツールとして使える。DSpaceやXooNIpsのコミュニティが出来て、中核となる。それとクラウド、集中システムの関係はわからない
    • システム更新や技術、標準にキャッチアップするのは大変。1つの大学では難しい。
      • 共通サーバは選択肢
    • リポジトリ・・・1人でがんばればいい時代は終わり
      • 全体の図書館システムに統合して大きな影響力を持つ時代
      • 共通的な基板に乗ってシステムコストを下げる時代にもなってきている
      • 可能性としては出てきている

クラウド時代の機関リポジトリ」(前田さん)

  • 現場の立場の人にも来て欲しい/中小規模の機関の実態について知っている人に話して欲しい、ということで呼ばれた
    • 言葉を整理しながら考えたい
  • クラウドと機関リポジトリと聞いて浮かぶイメージ・・・
    • 人によって大きく違う/5人5様の観点の提供になるだろう
      • 逆に言えば・・・皆さんがなにを連想したとしても間違いではない
    • (前田さんが)ぱっと思いついた2つのイメージ:
      • 計算機・ネットワーク技術の発展の一般的な成果としてのクラウドシステムを機関リポジトリに適用すること
        • 今までに得られなかった種類・程度の利点を確保する
      • 独自に機関リポジトリを維持できない機関のためにも共用プラットフォームを用意しなければならないほど、機関リポジトリが不可欠という認識が広まった時代における機関リポジトリ
        • それほど普及してきた時代になにを目指すべきか、という観点
      • 話したいのは下だが、今日のテーマは上。そこに絞って話したい
  • 技術的進歩をいかに取り込むか?
    • NIIの共用リポジトリ・・・今までに得られなかった種類・程度の利点とは?:各大学にサーバを置くときには得られないメリット
      • サーバコストダウン
      • プラットフォーム別に話を分ける必要がない/操作スキルの伝承の簡易化
      • 冗長性の確保/バックアップの安全性
      • 今は計画されていないかも知れないが・・・データバックアップサーバやアプリケーションサーバを複数地域に置くことでの冗長性確保
      • 以上は・・・サーバ運用や入力の点でメリットがある、ということだけを言っている。コミュニティについてはなにも話していない
    • 保存・・・リポジトリ内のコンテンツ本文とメタデータの保存/復旧まで考えた保存、の2レベル
      • 対策を施す主体が違うレベル
      • コンテンツとメタデータの長期保存・・・NDLによる収集があるべき
      • 壊れたサーバの復旧・・・今のIRDB等のハーベストでは前と同じような復旧は(粒度的に)できない/それはそもそも第三者が責任を負うことではない
        • バイナリレベルのデータ保存等は各大学が責任を持って行うべきことではないか?
  • 地域連携活動にかかる課題と解決の方向性
    • 全員が同じクラウドを使うことにはメリットもある
    • 共同リポジトリと同じだけの地域の結束を持つことは困難?
  • 経営者層とNDLへの要望
    • NDL・・・復旧まではしなくていいので、データ保存の議論に入ってきて欲しい
    • 経営者層・・・時間をとってオープンアクセスについて真面目に考えて欲しい

国立国会図書館のデジタル化・デジタル情報収集と大学からの発信情報」(大場さん)

  • 国立国会図書館がやっていることが大学にとってクラウドとして使えるかどうか? あまり答えにはならないかもだが・・・
  • NDLの収集・提供対象となるデジタル資料
    • アナログ資料をデジタル化したもの
      • 紙の本をデジタルにしたもの・・・博士論文など
    • ボーン・デジタル=もともとデジタルなもの
      • ネットワークを通じて提供されるもの・・・機関リポジトリ提供コンテンツなど
  • NDLのデジタル化予算の推移
    • H.21-22でドカンと予算がついた
      • H.21 補正で127億円
    • 作業自体はH.22年度でほぼ終わっている/登録作業中
    • 博士論文デジタル化もその枠組の中で行われている
      • 2009-2010年度にかけて実施
      • 「NDLは古いところを担当して欲しい」とのことだったので、1991-2000年度にNDLで受け入れたものを対象にデジタル化を実施した
      • 同時に著作権処理も行う。NDLだけではなく学位授与大学での利用の許諾も同時に得てきた
        • 許諾を得るのも苦労がある。思ったほどうまくいかなかったかも?
        • 許諾が得られたものは年度内に画像データを各大学に提供する
      • デジタル化博士論文の提供イメージ:
        • NDL・・・所蔵資料をデジタル化/館内提供は無許諾でできる
          • 全文複写・ネット提供には許諾がいる
          • 各大学からの収集・・・まだ始まっていない
        • 各大学で提供するもの・・・許諾
  • NDLが収集しているインターネットで流通するデジタル情報:ごく一部
    • 無許諾でできるもの・・・国立大学で発信されているもの
    • 日本国内の発信情報・・・許諾を得てやっている
  • オンライン資料(電子書籍等)の収集問題
    • 出版者等が送信/クローラで回収してきたものを館内で閲覧できるようにする
    • 図書館というよりは出版を行うような大学全般に関わること?
  • 障害・災害対策と長期保存
    • 分けて考えなければいけない?
    • 障害・災害対策・・・短時間で機器・メディアが破壊されることにどう対応するか?
      • そこにNDLが役に立つ/立たないか?
    • 長期保存・・・マイグレーション/エミュレーション
    • 人手・お金はない。どうやるか?・・・悩んでいる
  • NDLの役割:
    • まだはっきりはしていない
    • 障害・災害対策:バックアップ?
      • 完全ダークアーカイブは、NDLの枠組みでは難しい。普段は提供しないバックアップは所蔵資料として使いづらい/複製自体にも許諾はいる
    • 長期保存:保存のためのメタデータをどう整備するか?
      • データ量が増えるとマイグレーションコストも膨大に・・・一箇所でやるのが本当にいいのか?

国立情報学研究所における共用リポジトリサービス」(安達先生)

  • 「これだけはやります」ということについて紹介する
  • 概要:
    • NIIで開発したWEKOをベースに、各機関が機関リポジトリを提供できる環境を構築する
    • 機関リポジトリを自立構築するのが困難な機関に対し、その困難を克服するための支援をする
    • ハード/ソフトはNIIが提供・運営する。その上で機関リポジトリを構築するサービス
    • サービス対象者・・・大学、短期大学、高等専門学校大学共同利用機関のうち、当面は新たに機関リポジトリを構築する機関
      • 当面・・・役所言葉。いつかは明示しない
      • サービス対象の根拠:
        • 博士論文が機関リポジトリで提供されるとすると、博士論文提供機関は日本に400ある。すべてがリポジトリを持たないと「博士論文のリポジトリでの公開」を提言しようにも不可能である。400の機関におけるリポジトリ設立を支援
  • サービス内容:
    • リポジトリシステム:WEKO。NIIの山地先生開発。開発者がすぐそばにいて問題が起きたら対応できるという利点
    • 料金:当面徴収しない。ここでも「当面」。catも「当面、料金は徴収しない」をもう20何年間もやってきた。おそらく徴収することはないだろう
    • ディスク容量:いくつかのオプションを検討中
    • サービスレベルは相談しながら具体化していく予定。変更の可能性あり
  • スケジュール:
    • 7月〜:ヒアリング開始。色々な要望を吸収
    • 9月〜:追加開発
    • 8月:マシン納品(震災で遅れた)
    • 10月:公募開始/システム講習会開催
    • 1月:試験運用
    • 2012年度:本運用開始
  • シナリオ:
    • NII-ELSで紀要を電子化していたようなところ/学内集中電子化が進んでいないところで、共用リポジトリによって環境整備を簡単にできるようにする
      • 機関リポジトリコミュニティに参加してもらう
      • 学外コンテンツ発信について共用リポジトリによって参入しやすい環境を作りたい
  • 以上がNIIが皆さんに申し上げられること
    • 通常、こういう話をするときには共用リポジトリが「なにでないか/なにができないか」をはっきり言う必要がある。それがまだはっきりしていない
    • 大きな大学で、ハードウェアが老朽化して入れ替える際に、共用リポジトリを使えないか・・・という声はたくさん聞く
    • 先行する200機関のために税金で調達したシステムでなにができるかは、まだなにも言っていない
    • ここまでの話は「最低限、これだけはする」。先のパネリストからバックアップや保存への言及があったが、まだ方針は決まっていない
      • 上位レベルのサービスをする際はNIIはなにをするかはっきしりないといけないが、それもまだ決めていない
      • どれくらいのサービスレベルでやるかもいろいろ議論して決めていかなければいけない
    • 具体的に決めなければいけないのはわかっているが、どういうレベルにするかが問題
      • catは震災のサービス停止で迷惑をかけたが、ああいう事態にあってcatはどういうレベルでサービスをすべきだったかは所内でも議論がある
      • 半年止まってもいいよ、という人もいるがそれでは困るだろう。しかし銀行のような絶対に止まらないシステムにするのはお金がかかる
      • 機関リポジトリは災害時にどの程度のレベルで動かなければいけないのか、は、提供するサービスの価値を自身がどう評価するかに直結する
    • いろいろご意見をいただきながら決めていきたい
  • 情報関係の言葉はすぐにダーティ、意味不明になる
    • クラウドを使う=経済的視点/セキュリティ上の視点から考えなければいけない
    • データセンターで行う場合と並べてみて、各機関がNIIの共用リポジトリとデータセンターどちらを選ぶか判断すべきところ
    • ただ、費用をとらないことは比較しようのないメリット。通常のクラウドはそれなりのコストを払ってクオリティを買う
      • NIIはそれよりも、共有資源をどう提供するかによって、機関リポジトリを中心とするコミュニティがどう育つかに関心がある
      • バックアップもやろうと考えているが、民間のデータセンターレベルのクオリティのサービスを提供できるかは不明。手持ちの経費とスタッフの制限がある
      • どう考えればよいか、ご意見をいただければ

ディスカッション

  • 逸村先生:普段のパネルディスカッションと流れが違う。および事前打ち合わせを試みたが、まとまらなかった。また、前田さんもおっしゃるとおり、「クラウド時代」ということを考えると、ぜひフロアの皆さんに、どのようにサービス展開を図るか/コンテンツを守るか/付随する問題があるかを考えて欲しい。はじめはこちらで議論を進めるが、後半ではフロアの皆さんにも考えてもいただきたい。
    • まずは順番に。竹内先生から、なにか補足や安達先生にあれば。
  • 竹内先生:素朴な疑問としては、NDLで機関リポジトリコンテンツを今後収集するのか。それとプリザーベーションの問題を考えたときに、冗長性として積極的に評価する話か、役割分担を考えなければいけない話か。
    • 大場さん:機関リポジトリを集めるか否かはまだ議論になっている。法的には集められるが今は集めていない。長期的に各機関が発信できる場合には収集対象から外すことも法律上、できる。今は暫定的な保留状態だが、正式に外すか、今後集めるかは悩んでいる。最初に制度を作るときに大学の皆さんからは「え、そんなことやるの?」と言われたので保留と考えていたが、震災後は空気も変わってきて悩んでいる。フロアの皆さんのご意見から今後の材料にできれば。
    • 前田さん:集めるべき/集めないべきの空気がある、とのことだが、「集めるのが仕事じゃないか」という意見はNDLの中ではない? 「それを集めるのが仕事だ」と僕なら思うが。
    • 大場さん:おっしゃるとおり集めるべき、という意見はある。一方で大学の皆さんとお話しすると、こちらが強引にやるのではなくて・・・。納本制度自体、罰則規定はあるが「協力してください」というスタンスでやっている。これも同じで、大学の皆さんに「集めて欲しい」と思ってもらうところまで持っていけるか。
  • 入江さん:補足は特別ないが、僕にふられた課題の中で、媒体が増えると動画・静止画をどうするかという話があった。基本方針として、リポジトリとしては対応しないが、大学アーカイブが別に動いていて、そちらでは対応している。大学アーカイブの方がデータ量が多いので保存なども対応している。もう1つは、Googleのバックアップがデータ量が多い。データ量が大きくなってきている。
    • 動画については保存容量がないのでハイビジョンはやめた。編集だけで1台使う。慶應としては、もともと図書館とコンピュータシステムは1回結婚して、2000年に離婚したのだが、もう一度結婚を再考する必要があるだろう。図書館・ネットワークともコンテンツが重要になってきている。
    • 逸村先生:どなたか他に動画・静止画の話はありますか?
    • 竹内先生:むしろポリシーの問題。なにをリポジトリに入れ、なにをアーカイブに入れると区分けしている?
    • 入江さん:最初は一つでやっていたが、大学アーカイブは図書館事業だが、リポジトリは総合研究センター、研究者組織の規約を持っている。先生方のコンテンツはそこでやる。図書館としてやる事業は図書館で持ってやっている。
    • 竹内先生:「こういうコンテンツはリポジトリ、こういうものはアーカイブ」というのは動画・静止画だからか、経緯か?
    • 入江さん:経緯です。
    • 竹内先生:では研究成果としての動画が出てきたときにそれはリポジトリに載せない、という判断でいい?
    • 入江さん:COE等で動画が来ていっぱい持ってきていて、これを図書館では保存できない、となって、先生方がDVDで焼いて寄贈してきたものは持っている。それ以上をできるパワーはない。
    • 逸村先生:私の研究の中で、現代GPの成果として、子供向けにサイエンスコミュニケーションのコンテンツを実演した記録を動画にした。最終評価でそれが高い評価を受けたのだが、そのビデオを見せないと、報告書だけではいかんともならない。それをどうするかは機関リポジトリ担当者と相談している。そういうものは大きくなってきているが、容量の問題ひとつとっても真面目に考えて始めないと始まらない。
  • 前田さん:共用リポジトリについて、安達先生が最低限したいといって発表された内容を聞きたい人はたくさんいる。DRFでも他でも「NIIのリポジトリっていつ使えるようになるの?」という話は何度も聞いた。それほど要望が高いものであるのは間違いない。なんで私が「もうちょっと待ってね」と言わなければいけないのかわからなかったが(笑) クラウドサービスは有料が当たり前、というのが凄く当然なのだが、みんな待っているのは確かだが、外の組織の人が用意してくれるのを待っている感じはある。外部からサービスを受けるのだから有料が本当だ、という意識が本当であって、ちゃんとそれを言っていかないといけない。どこまでの規模でサービスを実施されるかは中小規模大学等の意見を聞けばいいと思うが、僕はサービス盛りだくさんの共用リポジトリでなくてもいいと思う。本来、対価を払わなければいけないプラットフォームを借りることとセットになったサービスレベルだと思う。なんかあればいつでも文句を僕に言ってくれればいいが。
    • 入江さん:有料にすべきってこと?
    • 前田さん:すべきとまでは言わないが、「有料が本当なんだ」ってことを示す程度の対価をとるか、無料で提供するならサービス盛りだくさんでなくてもいい、ということ。
    • 逸村先生:安達先生、何かコメントされますか?
    • 安達先生:サービス=有料でないケースもたくさんある。インターネットで手広くやっているところはただでやるかわりに個人情報を得て、それを売ってビジネスをする。アメリカがこの10年くらいやってきたこと。その観点で言うと私どもは機関リポジトリをただで用意することで、提供されたコンテンツをただで使ってなにかしたい。CiNiiから無料で飛べるコンテンツを増やす、など。データ収集の道具として機関リポジトリを使うとも言える。もう1つは、有料にすると根性入れてサービスをしないといけないのでプレッシャーが高まる。3点目は、CiNiiも(震災で)止まった時には止まった分のお金を返さないといけないとか大変だった。個人的にお金をとってその分良いサービスをするのは健全だとは思う。我が国には今、国からお金をとって図書館に回すということがなくなった。運営費交付金の中で一律的にやらないといけなくなった。私学助成金でも図書館向けに大々的に予算がつくことはないだろう。大学共同利用機関はその中で唯一、まとまったお金を国から確保するパスがある。いつまで続くかはわからないが、補正予算で共用リポジトリのお金を確保できた。シンプルなロジックで言えばそれを各大学に渡して独自にリポジトリを整備するとか、民間企業に払ってサービスを買うほうが国の繁栄をもたらしたかもしれないが、そういうロジックが今は国にない。納税者に理解してもらえるかたちでどうお金を使うかがNIIの立場で重要なところ。図書館の立場で広く使われて有益な情報が集まり大学が活性化することに寄与した、と言ってもらえれば良い。そういうことで先にお示しした方針になった。ただ、あれも絶対ではない。運営の費用が必要になったら料金を設定することはあり得る。そのことについては色々また相談していい方策を探さなければいけない。
  • 大場さん:特に質問はないのだが、セッション4の後半を聞いて、今日の前田さんのお話も聞いて、リポジトリを残すというのはコンテンツとデータだけでなくコミュニティを残すことでもあると感じた。そこに当館はあまり関与できないのだが、コミュニティをどうするかも今後は考えていっていただけると良いかと思った。
    • 逸村先生:NDLが出てくるといつもNDLにお願いする話ばかりになるのだが、こういう機会なので皆さんに考えて欲しいことはない?
    • 大場さん:長期保存については皆さんに考えて欲しい。データフォーマット、メタデータとしてどこまで記録するか、OSやソフトウェアが変わったときの対応も含めて、事業の持続性を長期的に考えていただけると有難いですし、そういうところで議論にNDLも参加するなど、お手伝いできることはあるかと思う。
    • 安達先生:長期保存については私はエンジニアリングの立場からは理解出来ない。今できることをして、10年もつ。10年もつのでいい、と確信を持ってやるしかできない。20年もつ方式があったとして、そのコストやワークフローは見積もれるが、その中から選択することしかできない。50年後どうなっているか・・・と考えるとできない。個人的に忸怩たるものはあり、CiNiiの昔のフルテキストが400dpiしかないことなども今見るともっとよくしておけば、と思うのだが、紙があれば遡ってやることもできる。コストとニーズを考えて繰り返しやれることをやるしかないだろう。DVDなんかどうするのか、MPEGにするとクオリティは落ちるかも知れない、そうすると似たような問題は数十年後に起こるかもしれない。コンテンツに対してどういう価値を置くかで決まる。図書館の人にとってやりにくいのは、一律に「こうせよ」と言われると大変なんだろう。がんばらなきゃいけないコンテンツと優先度の低いものが判断出来れば、その範囲でやるしかないのではないか。もう1つは、色々なリスクを考えると分散して多様性を維持するのが生き延びる方法。一機関に任せるのは見通しのよう生き残り策ではない。
    • 入江さん:保存の話だが、僕らは貴重書を撮影しているので大きなリスクがある。僕らが撮っているのは紙なので、データがなくなればもう1回撮影すればいい。ずっと大きいデータを保存できる自信はないので紙を保存する。データ自体はrawデータでやっている、圧縮はしない。マイグレーションするしかないと考えている。デジタルデータを長期的に保存するのは基本的に無理、マイグレーションするしかない。マイグレーションし続けるには組織を維持することと、マイグレーションが安いこと。マイグレーションできる範囲でやるとしか考えていない。
    • 大場さん:安達先生の「10年」というお話があったが、10年もてば万々歳。WordやExcelならば10年もたなくてもPDFにすればある程度の期間は見通せる。そのレベルのことができるだけでもぜんぜん違う。400dpiモノクロの話があったので、我々も経験したことだが、今回のデジタル化では400dpiのカラーにしたが、そうするとデータ量が大きすぎて扱いに苦労している。どこで切り替えるかのタイミングもなかなか難しい。
  • 逸村先生:共用リポジトリの話にも戻りたい。フロアの意見を聞いてみたい(min2-fly:例によって質問者名等はメモしないよ!)。
  • Q. 基本的に税金で社会衛生を維持するには保健衛生の仕掛けが絶対に必要である。みんなで保険料を払って国民健康保険を維持するのは世界が羨む仕掛け。社会を衛生であり、保健衛生的にミニマムなレベルと応分のコストがある。税金でやるか、自分のお金でやるか、さらに余分な分を払うか、という3つくらいをそれぞれが意識していれば困ることはない。「この部分はネットワークの維持のために税金でカバー」など。大きな大学がサーバが古くなったから面倒みて、なんて我侭・無責任を認めてはいけない。自分たちの生命線を健全に、時には大学間のネットワークでNDLを補完するようなものを持つ、高くても/コストをかけても維持する、ビジネスモデルを含めてお金を調達するなど、レベルを分けて考えることの比喩として、どなたかへの質問というわけではないが。コストは絶対かかる、ただのものはない。さらに言えば生きるというのはリスクの中に生きるということ。
    • A. (質問、というわけではないので特になし)
  • Q. 安達先生と他の方にも。共用リポジトリとはNIIのクラウドの中で動く機関リポジトリシステムと受け止めた。CSI事業の中にはリポジトリそのものではなく千葉大学のROAT、筑波大学のSCPJなど、機関リポジトリを助けるようなシステムもある。これをクラウドに取り込むことはお考えか? また、そういったものをクラウドに入れてみんなでやるのはうまくいくのか? どこかが責任を持ったほうがいい?
    • A. 安達先生:SCPJやROATのような共通的に必要なサービス・活動については、NIIのfacilityの上で動かすことを念頭に置いて色々考えている。プラットフォームから下の話は技術的に楽。なんとかなる。それを維持する人間の活動をどう上手くやるかが最大のポイント。そこでうまくネットワーク上でバーチャルにできるコミュニティとそれを支えるコミュニティができて、動く姿をどう作るのか。それは個別に対応していかないとうまくいかないと思う。そのためには所属する図書館だけではなく活動全体のためにある仕事をする、ということが、いいことだと認知され、そういうことに対し評価が行われる、環境の醸成が重要になる。今日の会合もそれにつながればいい。
    • もう1つ。NIIとしてはそういった活動(SCPJ等)は、「NIIがやればいい仕事だね」となるのは力量的に難しい。図書館全体としてうまく担えないか。委託事業はずいぶん年数もたってきたが、そういうコアとなる活動を図書館コミュニティがどう認知し、育てるべきと考え、色んな努力が向かうような、そういう構造を図書館コミュニティの中で成立することを期待している。そこが共用リポジトリのポイントだろう。
    • A. 前田さん:例えばNIIの共用リポジトリの中でリポジトリをサポートする既存プロジェクトが利用されるのがいいのか、別の方がいいのか。SCPJなんてプラットフォームと関係なしに必要である。WEKOで共用リポジトリをやることになったとして、その講習会はWEKOの使用説明だけなんてことはない。著作権の話をはじめなんのためにその作業をするのか、という価値観を共有しながらやることになるだろう。SCPJやROATはじめ、既存プロジェクトが不要な共用リポジトリなんてありえないだろう。
    • Q. 心強いお言葉をいただいたのでクラウドに向けて進めていきたいし、こちらの皆さんにもみんなで共同でつくっていく、というのは他もみんなそうだと思う。そういう気持ちでやっていけたら。
  • Q. 安達先生に。WEKOの話が興味深かった。新たに機関リポジトリを構築する大学が対象、とのことだが、これはいずれはWEKO利用大学も各自のリポジトリを持つことを考えているのか、それとも今は独自リポジトリを持っているところがWEKOになっていくことを考えているのか。個人的にはいずれはどの大学もクラウド化を考えると思うが、ばらばらにベンダを選ぶよりもNIIのような信頼性の高いところを選びたがるのではないか?
    • A. 安達先生:これから来年の3月くらいの展望として、先にプレゼンした内容はやる。今、ご質問の内容については皆さんのご意見・ご要望を聞いて方針を立てたい。やらないと決まっているわけでもないし、やりますとも申し上げられない。個人的には山地先生がいらっしゃるので言い難いが、WEKOはいいシステムだとは思うが、世の中の多くの人はDSpaceを使っているし、多様性は大事だと思う。一方で色んなソフトを載せてなんでも対応できるようにするのもどうかと思う。どこに収斂するのか、こちらの力量も含めて考えたい。ハードウェアやディスクスペースの問題は解決が用意だが、ソフトウェア、アプリケーション、人の関係するコストが大変。ユーザニーズとの折合わせが。
    • 逸村先生:山地先生なにか。
    • 山地先生:WEKOで日本を牛耳りたいと思っているわけではなくて、色々あればいい。DSpaceを使っている大学がこれだけ日本にあるのに国際的なDSpaceコミュニティと関係出来ていないのも、うまく日本のコミュニティが国際的な活動に絡むところに持って行きたい・・・共用リポジトリとは関係ないが。それからクラウドからの卒業を想定するか、滞留することを想定するのか、お答えがなかったが?
    • 安達先生:クラウドを使うか否かはコストの問題。自前が安いか、データセンターを借りるのが安いか、NIIが安いのか。すべて価値判断を入れないといけないので、安いところを選ぶのが正しい利用スタンス。ただ、絶対的に言えるのは、クラウドを使うのは安くない。付加価値を付けているので、基本的な経済原理として利益はとっている。高い。高くても求める、というのが民間には多いので成り立っている。大学でクラウドサービスが成り立つかはやってみないとわからない。電子メールをアウトソースする大学も出てきているが、本当に安いのかどうか。大学で、アカデミック・ディスカウントがあるから安いのか。ディスカウントの利点はあるかも知れないが、今のところクラウドで機関リポジトリをやる話がビジネスとして広まっているようにも思えない。NIIは国からお金をもらった下駄があるので安い。民業を圧迫するつもりはない。民間企業にお金を払ってビジネスが回るようにすべきでは、と叱られることに注意しないといけない。
    • 山地先生:NIIの中でも議論はしているが民業圧迫については結論は出ない。お金を払ってまでも機関リポジトリを運用する意義を考えて貰う意味では有料化も意義があるかもと思うが、結論は出ない。まだ悩んでいるフェーズ。
    • 竹内先生:今の問題は大きな問題。安達先生からコストの話が出た。安達先生はシステム周りの話をされていたが、もうちょっと大きいレベルのコストを考えないといけない。コミュニティの維持の重要性についてご発言があったが、様々なスキルを学術情報を扱う人間の間で継承するコストがある。短期的な利益を追求してその部分を失ってひどい目にあっているのが公共図書館の世界。いろんなことまで含めたトータルコストを考え、機関リポジトリの役割を考え、すべてを決定しなければいけないのではないか。言うのは易しくて考えるのは難しいが、そういう意識はもっていたい。
    • 前田さん:トータルコストについて一言。近畿でDRF-ShareのWSをやったとき、小大学で、サーバは買ったが業者は入れられない、というところにDSpaceのインストールをして、サーバを買うときに業者について行ったりもした。そういうことができたのは、そこは図書館員も少ないところなのだが、Linuxも触ったこともないのにリポジトリを立ち上げるというので意気に感じて手伝った。その人は今、サポートを受けながらであるがDSpaceを入れ、自力で今年リポジトリを公開するところまでいった。DSpaceのスキルだけでなく、仕事に対する生きがいまで含めて感じている。自力構築にはそういう数字にはあらわれない成果、職員のやる気のようなものまである。そこまで考えて、自分のところはなにを選ぶか考えないといけない。一概に、サーバの導入経費だけで考えないように、と言いたい。
  • Q. 質問というより意見。コストの話が出たが、低レベルなコストの話を。当面、NIIでは無料とのことだが、私は前田さんとは別の意味で金はとったほうがいいと思う。基本料金やオプションなど。そこで取らないと、未構築のところが「リポジトリというものが流行ってるからやらな」と考えたトップが、「ただならNIIで」となる。あるいは維持できなくなったらただだしNIIへ、と思うトップも出てくる。そうすると、一生懸命お金もらってがんばっているところが、馬鹿馬鹿しいというとおかしいが、「今まではなんだ」となる。お金をとることを前提で進めた方がいいのではないか?
    • A. NIIの中で、僕はお金をとるべきという立場の方。ただ、お金を取るというのは難しい、自分のサービスに値付けをするときの相場観がない。これは個人的なこととして聞いていただきたいが、大きな大学からはしっかりお金をいただいてビジネスライクにやった方が健全だろう、と思う。大きなところから小さなところまで料金表を作ってやるには会社を作ってやるくらいの根性がないとできないが、そういうビジネスチャンスはある。まだそこまで詰められていないので、当面は施行ということでとりあえず前に走ろうと。先行大学から「それは具合が悪い」というご意見があれば伺いたいし、大学の事情もあるだろう。私たちはstrictに考えているわけではないのだが、透明性を確保しながらフェアでないといけない。こういう活動はリソースのあるところからないところに回すのが基本なので単にビジネスライク、というのでもないだろう。そこのところ、どう設計すると上手く行くのか。お金をとってうまくいく仕組みが思いつかないので。
  • Q. バックアップ面での質問というか意見。リポジトリを運用して間もなく10年になるが、最初の頃に納品されたもの、いただいたデジタルデータはフロッピー。フロッピーがそれほどもつとは思えないのでディスクに保存し、サーバにバックアップし、サーバのバックアップも保存しているが、いざ読めないPDFが出た際にどこまで戻ったら復元できるか把握出来ていない。この先博士論文はデジタルデータで出てくることもあるだろうが、それを機関リポジトリで永続的に保存するとして預かった場合、それをどうバックアップを取るのか。そこでは是非、大場さんにバックアップを吸い上げていただきたい。CiNiiで連動するにしてもあくまでメタデータは大学のデータ。まして私学にシステム担当者は半分もいない状況で、そこでバックアップをどう考えるか?
    • A. 大場さん:ご意見ありがとうございます。博士論文は確かに将来的にデジタルの話が出てくるだろう。これは機関リポジトリの収集とは別枠になるだろうが、今、紙で保存されているものを将来的にはNDLにデジタルで、ということにもなるだろう。ただ、それと機関リポジトリのデータをNDLで維持するのはまた別の問題かと思う。
    • 逸村先生:これはデジタルになると必ず出てくる問題。
  • Q. 共用リポジトリは自力構築したサーバではないのでセルフアーカイブとみなされないのではないか? 自機関で構築してないものをセルフアーカイブと認めてもらえるのだろうか?
    • A. 安達先生:考えなければいけないことを思いついていなかったが、契約上は大学のコンピュータがネットワーク上に構築されていることになるわけで問題ないだろう。物理的にキャンパス内にサーバがないといけない、と言われたら困るが。
    • A. 前田さん:私もデフォルトで各大学のもの、となると考えていた。レンタルだろうが買ったサーバだろうがそこは重要ではないだろう。そこに慎重なことを馬鹿にはしないが、他に悩みたいところはいっぱいある。細かいところは都合のいいように解釈する、ということでどうだろうか。
    • A. 竹内先生:前田さんと同じ意見。出版者から文句を言われたときの理論構築をすればいい。
    • A. 安達先生:共用リポジトリにある大学が入った場合、IPアドレスとURLはどうなる?>山地先生
    • 山地先生:IPアドレスはNIIから払い出し、FQDNは〜.nii.ac.jp。我々はシステムを提供するだけで運用するのは大学の方。データを入れるのも著作権も大学が持つわけなので、そこに問題は生じないだろう。
    • 安達先生:大学名.ac.jpがつくようなURLにはできない?
    • 山地先生:各大学のDNSとの連携もいる。
    • 安達先生:各大学がやるといえばやる?
    • 山地先生:明言はできない。
    • 安達先生:せっかくやるのにnii.ac.jpじゃ各大学にとっては格好悪い。
  • Q. 日本には80万人くらい研究者がいて、うち半分くらいは民間にいる。残る半分のほとんどは大学だが、一部は国研が持っている。CSI事業もそうだが国研はどうしても後回し。オールジャパンの体制はどう考えればいい?
    • A. 安達先生:国研の優先度が下がるのは、国研はお金持ちの場合が多いので、それよりも大学に優先度を置いている。そのへんの雰囲気がこなれてきたところで国研も、と考えている。また、やるとすれば国研はトップダウンなので楽。やれと言われればやる。大学は色々なステークホルダーがあって、学内政治、アドミニストレーションの難しさがあるのでそちらをやってきた。プライオリティ付けをしているのははっきりとしていて、それは今のところいかんともしがたい。
  • Q. 安達先生のお話の中で今後5年間を、というようなお話があったが、IRDBを見ても過去5年分しかないわけで、この先の5年の地平線は広い。80万件のコンテンツが160万件になってCiNiiで活用出来れば嬉しい、というようなことなのだろうが、そのときクラウドはどの程度寄与する?
    • A. データ増には極めて楽観的。そこのノウハウはある。機関リポジトリの増加については、個人的な思いとして、大学の情報発信をがんばる、というのが上層部を説得するにも有効だし、そういう風に動いているケースが多い。もう1つの側面は電子ジャーナル高騰への対向としてのオープンアクセスコンテンツ増加。その点の動きは日本はもう一つ強くない。そこをどう強化するか、というところで今後どうするかが課題。コンテンツ増加はそういう点で増えるとありがたくて、OAの観点から日本の研究者が応分の貢献をする基幹として機関リポジトリが機能すると良い。博士論文の公開など。外に公開するための機能についてNIIとしては最大限の努力をしていく。



時間があれば質問しようかとも思ったのですが、時間いっぱいディスカッションが続いていたので会場での発言は遠慮しました(汗)
気になった点がかなり具体的/細かいところだったので質問しても「まだ決まっていません」って言われるんだろうな、というのも遠慮した理由の一つですが。


まず話題の中心、NIIによる共用リポジトリについては、参加大学に対してどの程度の容量/サービスを提供するのか、というところの設定次第で個別構築との差別化が自然にできないか、という気がしました。
できるだけ電子化してOAにできるコンテンツを増やしたい、という点ではコンテンツ数に上限を設けるのはあまり得策ではない気もしますが、とはいえ容量も無制限ではないとなれば、一機関あたりの利用容量に制限をつけるか。
あるいはコンテンツの種類を限定する(媒体で限定するなら話題の一つでもあった動画等は駄目、ということにするとか?*2)/研究成果に限定する、なんてのもあり得るでしょうか。
特別なことがしたいところ/大規模にやりたいところは独自構築/そうでないところはクラウド参加・・・となるのか、それともいわゆるフリーミアム(一定以上のサービスには課金)になるのかはわかりませんが・・・そのあたりも、この1年間で議論されていくのかな、とかなんとか。


もう一点はNDLと機関リポジトリコンテンツの関係について。
これは会場で大場さんとも直接お話ししたのですが、機関リポジトリに登録されたファイルをNDLでも持って、独自に永続的な保存・アクセス保証を行う(マイグレーション/エミュレーションなども時前で)となると確かにいろいろ大変だと思います。
ただ、単に冗長性を確保しておく・・・という意味ではInternet Archive等と同様に、あるいは我らがGoogle先生のクローラと同様に、その時々で、あるいは更新分だけ、機関リポジトリ登録コンテンツをNDLでクローリングして持っておく、というのであれば特に難しくもないし、すぐにでも出来るのではないか、とか。
もともとのOAの理念としてはそんな感じでじゃんじゃんクローリングしてもらうことが念頭に置かれているわけですし(もっとも日本の機関リポジトリコンテンツで再配布まで許すいわゆるlibre OAのものはほとんどないのですが)、図書館における紙の本と同様にいろんなところで持って、それぞれが保存の努力をすればうまくいけばどこかでは生き残ることもあるかも知れないよね、的な感じにも近いですし。
もっとも、NDLがやるとなるとなかなかそういうただファイル持っておくだけ、って事はしづらいというのもなんとなくわかるのですが・・・。


以上が今日のディスカッションを聞いていて気になった点です。


2日間、通しての感想としては、昨日のセッションでも少し話が出ていましたが、「クラウド時代の機関リポジトリ」というのは

  • さしあたり大きなところはだいたいもうリポジトリは持っている
    • (安達先生から「400大学」という数字も出ていましたが)単独では構築が困難なようなところをどうするか、というフェーズである(共用リポジトリ/共同リポジトリ
  • 既にあるところにとっては今後の永続保証や、構築したものを如何に活かすか/コンテンツ収集を効率的に行うか、という話をする段階である
    • CSI領域2関連の各事業
    • 永続保証/バックアップに関連してはNDL等とも含めての検討がいる
  • 事業を通して見えてきたのは「コミュニティの重要さ」である


ということなのだなあ、と・・・そう考えると「萌える」「試される」「つながる」という昨日のセッション名はよくできていることがわかります*3


その中で大きなポイントとなるのがNIIによる共用リポジトリであり、それは昨日から(まだ正体が明かされる前から!)たびたび話題に上がるのも当然だなあ、とかなんとか。
今年度中に議論を詰め、来年度にはいよいよ運用が開始されるとのことですが・・・これは今年のこれからの動向も引き続き注目していく必要がありますね(って注目してなかったことはないのですが!)
CiNiiが昨今しばしば一般のニュースメディアにも出てくるように、再来年あたり共用リポジトリ/WEKOに大学・図書館業界人に限らず衆目が集まるのでは、なんて考えるのは早すぎかも知れませんが・・・。



  • 2011-06-16 13:10 メールでご指摘を受け誤字等を修正

*1:2011-06-13 - かたつむりは電子図書館の夢をみるか

*2:ところで、前日の前田さんのプレゼンテーションの中で、成果が論文にならないような音楽や芸術、体育分野に関するDRF-WSが昨年度は開催されたというお話がありましたが、そのあたりと動画/静止画コンテンツの扱いの話はかなり絡んできますよね。共用リポジトリで扱わない、となるとそうした大学等は自力構築にいくしかないのかなあ・・・

*3:もちろん実際にはそういうセッション構成だったから上記の感想が出ているのである、とも思うわけですが