1日目 10:30〜12:00 国立国会図書館主催・フォーラムプログラム 「国の『デジタルアーカイブポータル』構築に向けて -国立国会図書館の取り組み-」 国内デジタルアーカイブを構築・検索するための取り組みの内容と、これからの国立国会図書館の取り組みの方向性についてパワポによるプレゼン方式で行われました。 パワポのプリントアウトや、各種デジタルアーカイブプロジェクトのパンフを参加者に配布されてます。 内容。 国立国会図書館が「デジタル情報」を収集対象にしたことの課程と、その方法について、また、これまで「単館主義」ともいわれていた国立国会図書館が、近年において、他機関との連携と協力を明確に取りくみ内容の一つとして打ち出していることについて説明。 今後資料のデジタル化を推進していくにあたっては、旧式化した媒体(例えばレーザーディスク)や、電子伊情報の技術要素(ハードウェア・記憶媒体・OS・アプリケーション)の変化への対応や、著作権の処理をクリアしていく必要があるとともに、国立国会図書館だけではなく、他機関の資料のデジタル化を推進していく支援も行っていくべきとしている。 将来的には現在個々に分かれているウェブ上の情報をゆるやかにつなぎ合わせ、ユーザは、ネット上の情報群を様々な入り口から統合的に探し出すことができるような仕組みを作りあげることを目標としている。そのためには様々な仕組みづくりが必要になる。 国立国会図書館は国内においては図書館にとどまらない(大学機関リポジトリ・民間出版社等の)機関と、また各国の国立図書館と連携を行うことで、世界レベルでのデジタルアーカイブ構築の一翼を担うことを役割の一つとして活動をしている。 質疑応答 Qマイクロフィッシュ資料などは今後劣化が進むだろうが、今後どう扱うのか A元本保存がこれまでのスタンダードだったが、いずれはデジタル化したい。とはいえまだ今は見られるので、順番としては後回しになる。全デジタル化には時間がかかるだろう。 Q読めなくなった電子資料をどう扱うのか A最終的にはエミュレーション(新しい機器上で旧環境を仮想的に作る)で対応。 Q現在連携について協議している日経BP社 以外のニュースサイトの収集はどうするのか(例えば、毎日新聞のウェブニュースは問題が起きてから当該記事は全く見られなくなってしまった) A国会図書館だけで対応しきれる問題ではない。今のところ足がかりにしようと交渉しているのが日経BP社であり、他社からも申し出があれば受け入れる。 毎日新聞のような件は、すぐにアーカイビング化は難しいだろう。将来的には民間ニュースサイトの情報も収集対象としたいとは考えているが。 Q図書館のデジタル化支援について、デジタルアーカイビング用のオープンソースソフトの図書館への提供の検討はどうか。また、小規模図書館でもデジタルアーカイブに参画できるのか。 Aアーカイビング用ソフトのオープンソース化はこれから。広く参加できるようにしたい。国会図書館のノウハウは、(旅費さえ負担してくれれば)呼んでくれたら積極的に提供する。 現在のモデルケースは岡山県(デジタル岡山大百科)。それに続くための支援(国の支援や環境整備)が必要になる。予算化されれば来年からスタートする。 感想。  国立国会図書館の目標は壮大であり、世界中の情報がデジタル化され、見られるようになったとき、地域の公共図書館の果たす役割は大きく変容しているだろうなぁ…。なんて月並みな。最初のフォーラムから面白くて、「図書館総合展スゲー」と思った田舎モンです。ハイ。 1日目 13:00〜17:00 図書館総合展運営委員会主催・フォーラムプログラム 「学術情報オープンサミット2008 特別企画 デジタル時代における学術情報と図書館 -貴重な資料の保存と未来への活用-」 講師:長尾真(国立国会図書館長)・土屋俊(千葉大学文学部教授)・西尾章治郎(大阪大学副学長)・二木麻里(翻訳者・人文科学系ポータルサイト「Ariadne(http://ariadne.jp/)」主宰)・佐々木俊尚(ITジャーナリスト) 長尾国会図書館長の基調講演のあと、4氏がそれぞれ自論を話し、その後土屋教授が司会に回り、4名によるパネルディスカッションという流れで行われました(パワポを準備してる方もいらっしゃいましたが、配布資料は無し。なので、一生懸命手書きメモしました)。興味深い内容だったので、当日のメモ書きをあまり割愛せずにそのまま載っけます。 ・長尾国会図書館長基調講演 「デジタル時代における学術情報と図書館」というテーマはなかなか難しい。この後話し合う前提としての話をする。様々な問題について全てを話すことはできない(時間が足りない)。という前置きで始まった。 I.情報の時代  現在はどこにいても情報とつながっている時代。情報を利用して活動できる場としてのインターネット上においては、全ての人間が読者であり著作者になれる。  情報の利用→創造→保存→利用・・・というサイクルがある上での図書館の役割は、収集→整理→保存→提供となる。しかし、利用→創造→保存→利用・・・のサイクルの速度が上がっているのが現在である(例:学術雑誌の流通スピードは以前船便が数ヶ月遅れで海外から届いていたものが、今は発表後即電子版が読めるなど、格段に上がっている)。 その状況において、様々な知識、様々なメディア、様々なデータベースが出てきている。 ここで、ネット上のさまざまな情報の統合と利用、分類、リンク付け(メタデータ=情報に関する情報 を与える)を行い、検索する仕組みを作れば、人が本当に欲しい情報にすぐたどりつけるようになるだろう。が、現在の巨大な情報群にどうメタデータを付与していくかは大きな課題になる。 II.知識基盤づくり 21世紀の知識基盤…知識の集積拠点(図書館・情報センターなど)の整備が不可欠。ただ、一箇所集中型では全ての情報を集めるのは無理だろう。分散、協力しての収集が必要。 また、集積された知識・情報の体系化、異種の知識・情報拠点のリンク付けや、グローバルな知識・情報システムが構築できるのか。現在は理想へ程遠い状態。 インターネットは知の基盤になるのか?信頼性・信憑性は吟味せねばならない(出版物についても程度は違うが同じことが言える)。必要な情報のみが取り出せる検索システムをつくらなければならないが、その仕組みはどうするか。常に変化し続けるインターネット上の継時的な把握はどうするのか。課題は多い。 またwebアーカイビングはどのような情報源に対して行うのかも重要(全て集めていたらきりがない)。(官公庁などの)一部のウェブサイトは作成者の許諾無しに(国会図書館が)収集できるように来年には法律化したいと考えている。 III.電子ジャーナルの時代 現在約6万件の電子雑誌が刊行されている。うち7000程度が電子版のみ流通しており、うち2400件程度が学術雑誌である。電子雑誌は廃刊しないという特徴がある。なお、国内では740誌が「J-STAGE(科学技術情報発信・流通総合システム)」に登録されている。 オランダにエルゼビア社という出版者があり、この会社の影響力が電子ジャーナル界においては大きい。2200の電子雑誌(科学・技術・医学系が中心)を発行。電子ジャーナル界における学術論文の四分の一がこの会社から出ており、発行に携わる研究者・査読者・編集者も桁外れ(勿論世界中の人間が携わる)。こういう会社があることで、日本の電子ジャーナルが世界に影響を与えるにはなかなか至っていない。 機関リポジトリ…大学・機関の電子成果物(論文・紀要・報告書・資料など)を外部公開。有意義な取り組みではあるが、日本ではまだ歴史は浅い。保存方法、保存期間、著作権者との関係調整や、大学がなくなったりした場合の情報の保存場所などがネックになっている。 Google booksearchは図書館のライバルになる。現状、Googleには金がある。図書館には金がない。Googleにお金で解決されるのは、図書館にとっては苦しいこと。とはいえ、将来Googleもどうなるかは分からない。だから、国立の図書館が必要(向こう数十年は企業が優位だろうが…) 。 IV.大学教育における図書館の役割 大学教育も変化のさなかにある。遠隔教育、教科書のデジタル化(教科書に動画を入れたり、演習の回答を可視化するなどの効果)、授業のビデオ化、遠隔地との対話教育(ネット通信教育)など…。電子図書館やネットが大学教育において必要になってきている。 司書はこれまでの図書の管理から、情報のガイダンスや相談業務に仕事の中心がシフトしていくのではないか。また、図書館における記録のアーカイビング機能が注目されるだろう。 V.研究図書館の使命 電子ジャーナル・電子リポジトリの充実が必要。研究の支援機能を果たす。研究成果である論文でなく、そこに至るまでの実験試料も提供できるように。 世界中の論文や会議録の収集など、やるべきことは多い。また、データベースの活用支援が(検索に専門的なスキルを要するものは特に)求められる役割になる。 大学図書館は将来、分野別に専門化していくべきである。 VI.オープンアクセス 知識は人類の「共有財産」である−それが図書館の精神。 しかし利害関係がそこに発生するだろう(例えば国と国の利害など)。だからオープンアクセス化は理想だがなかなか広まらないのが現状。 著作権について…論文へは著作権上ではフリーアクセスにすべきでは。論文を発行する学会は別の役割を持つべきで、権利は特許権などに頼るべきではないかと考える。 ・土屋教授 学術情報を二分すると「インプット(教育においては教材、研究においてはデータや研究資料)」と「アウトプット(教育においては人材、研究においては論文や特許)」に二分される。 情報の電子化で、教育・研究方法の変化、情報流通の変化が起きている(依然として教室中心ではあるが)。 学術振興は情報入手から始まってきた歴史がある。高等教育を日本語でできる(明治以降)、総合目録や論文の統合化、図書館協力など(戦後復興以降)…しかし最近はあまり「情報入手」に注視がされていないのでは。 インターネットによる学術情報… *電子ジャーナル 21世紀の常識(大学では)。世間ではあまり知られていないかもしれない(例えば、インターネット上の情報なのに見るのにお金が沢山かかることなど)。 *個人ページ 盛ん(個人研究者のブログなど。例に「かたつむりは電子図書館の夢をみるか」があげられてました) *機関リポジトリ 盛んになりつつある しかし、これらの情報に伴う変化は、大学外のひとにどのくらい知られているのか。「電子ジャーナルの"質"」や、サイト上でのみアクセスできる情報があること、最近の大学は「本」よりも「電子資源」の方に使う金額が多いこと、などなど・・・。 研究の内容についても、実験を行わずにひたすら計算だけを行う研究があることや、論文よりも研究発表が重視される分野があることがどれくらい知られているのか。 大学の評価、大学における評価…これからは大学の「評価」が本格化するだろう。国公立においては「税金」、私立においては「学費」で運営されている以上、やる必要がある。またこれからは「研究家個人」の評価も積極的に行われるだろう。   ・西尾教授 日本では学術雑誌の電子化率が低い(40%)。欧米では96%が電子化されている。この背景と要因は何だろうか。例えば、学術情報に特化した検索システムは国内では出てきていない。 これからはE-サイエンスの時代。「理論」、「実験」、「観測」、でない第四の研究(コンピュータ上で仮想環境を作成、そこでの実験を行うといった方法)。 →次世代の学術情報の方法論…高速ネットワーク上での連携(例:ネットワーク上で計算を行い、研究者が共有する)、学者だけでなく、システム開発者との連携が不可欠になる。 これからのポイントは「連携」「共有」「協働」 電子データの情報はどんどん増えている。研究開発のアウトプットは、インターネット上のデータも含まれる時代。次世代に、爆発的に増えている知的データを整理して残す義務を図書館は有している。 図書館は役割分担して、「連携」「共有」「協働」すべき。そのためにはインフラが必要。 それぞれの情報提供機関は連携強化をするべき。また、利用者ニーズの開発をもう一度行い、提供する情報に付加価値を与えなくてはならない。 日本は世界で最もブロードバンドが発達している国なのだから、それを使わない手は無いだろう。 図書館は知の泉から知をつむぐ手助けを。 ・二木氏 確実にデジタル化される情報は増えている。増加するデジタル情報を受け止められるには、環境が対応できていない。 データベース…先端性と遅れ感がある。ユーザにその有用性が伝わっているか(現状、素人には簡単に使えない、その凄さが分からないことが多い…特に学術系DBにおいては)。そこから不透明感や閉鎖感を受けることも。Googleに比べるとデータベースは「遅れている」と思われがちだが、データベースには可能性がある。 サイト…空間性(奥行き)を持たせられないか。数十億のページに対して見られるのは一つの窓。「物質性」がそこにはない。深層化したサイトには現状行きづらいが、アーカイブを作るためには必要。インターネット全体における「立体的」な現在地の分かる仕組みがあれば。 デザイン…インターネット情報をどう自分のものにするか。「開かれた綴じ」へ…インターネット上で「読んだ経路」の記録、編集ができる工夫、読んだページを「綴じられる」ような工夫があればいい。読者が書籍をページを気にせず好きな順で読むようなイメージで。 ・佐々木氏 情報アクセスは高度化しており、情報の量は増えている。それをどう処理するか。 収集は簡単なことではない。過去、情報としては集められたものは、どう整理・処理するかを考えられていたが、今は処理しきれる量ではない。例えば1日で300から400個のサイトの更新情報をどう処理するのか?見るだけで精一杯。 「情報のストック」から「情報のフロー化」へ。右から左へ流れる情報をどう使うのかを考えるべきでは。 そうなったときには「知」の取り組みも構造変化する。いかにして自分に必要な情報を玉石混交の情報があるネットから見つけるのか? 知識管理は情報アクセスの平準化を目指すが、うまくいかない。情報の分類が難しいため(一つの情報に対して一つのフォルダを決めて、入れるのは困難)。 これからは情報に「意味」を与える…メタデータの付与→セマンティックウェブ(意味のあるウェブ) これも難しい。やるには一からネットを再構築しなくちゃいけないし、コントロールされていないのがインターネットの良さでもある。 そこで、検索システムを洗練していくことが注目されている…意味の無いノイズの混じった情報から必要なものを探し出す(現在ではGoogleが信頼されている)。しかしこれも限界が近い。例えば70代の老人がGoogleのトップページからデジタルカメラの購入までいたることができるのか?そもそも「Googleの使い方案内」の本がある現状はおかしくはないか。誰でも使えるのがインターネットの理想である。 そこで、レコメンデーション(例:amazonの「おすすめ」機能…「過去」のみを参考にしているため完璧ではないが)や、ソーシャライズ(インターネット上の同類の人間によるおすすめや、履歴を参考にする…人間関係の「共有化」)などを合わせて高度化していけば、「人が何を探したいのか」分かるようになるかもしれない。 ・パネルディスカッション パネラーの意見を受けて、長尾館長としては。 …非常に難しい問題が沢山ある。これからの時代、知識情報を豊かなものにしていかないとならないが、その中で図書館はいかに手をつないで協力ができるのか。 巨大な情報群が「綴じられる」ことには色々可能性がある。Web情報の相互関係が、利用する人それぞれで異なる構造化が必要になるが、それは、図書の分解・再構成のような作業になる。図書の分解・再構成は大変だが、電子上ではそれが簡単に行えるだろう。 「開いた世界」をどう扱うかは大変な問題。いかに「情報を捨てるか」もこれからは研究対象になるだろう。将来膨大なデータを保存するための電力はどうなるのか、という視点から考えても、「情報を捨てる」という視点は必要(長尾)。 情報爆発(デジタル情報の爆発的増加)は今のペースでずっと続くのか? →どこかで破綻するといわれているがまだ続くだろう。汎用的なデータの中に隠れたキラリと光るデータを掘り起こす努力が必要になる(西尾) →「爆発」ではなくなり、それが「日常」になって続いていく(二木) →いつかは限界が来るのでは。そもそも人間が扱える情報量がそんなにあるとは思わない。今は「マスメディア」「パーソナルメディア」ではない「ミドルメディア」が増加している。特定分野の領域だけ爆発しているのではないか(佐々木) …情報の組織化は手動では難しい。機械的にやらせないと量的に無理ではないか(土屋教授) 。 会場との質疑応答 Q.ブラウザはページ1枚というが、本を読むときは見開き2ページだけしか見られないし、今はタブブラウザもある(FirefoxやIE7など最近のブラウザでは2つ以上のページを「タブ」で閲覧できる)。もう少し説明して欲しい(二木氏へ) A.二木:その1枚のページの置かれている文脈、立ち位置が分かるのか、と言う意味で言った(本においては前のページがあって、次のページがある、ウェブではその関係が見えにくいという意味)。 Q.日本の中でもJST(科学技術振興機構。前述の「J-STAGE」や学術論文誌及び特許文献全体のオンライン検索サービス「J-DREAMII」など科学技術に関係する各種情報を提供している)などがあるが、国策としての各種機関の連携をとうることで、エルゼビア社へ対抗するような方向性はあるのか。あと、SNS(ソーシャルネットワーキング。「mixi」が代表的)が現在流行しているが、そのメリットとデメリットについてあれば教えて欲しい。 A.長尾:電子ジャーナルをどうするのかはオールジャパン的に考えてはいるが、まだ話し合いの段階である。データの分散保持も方向性として考えている。 佐々木:SNSのメリットは人間関係の可視化。そこから独立した個人が生まれてくる。それをどう捉えていくか。人間関係に沿って情報を集めていくことが可能だが、SNSの中にある情報を見渡せばノイズが多い。「居心地の良さ」と「情報源」としての役割の両立がSNSのこれからの課題。 Q.フェアユース(許諾が無くても著作物が複写などに利用できる範囲を設定すること)について A.議論はなされたが、結論は出ない。フェアユースの推進は図書館での利用にもメリットは多いが、社会情勢にも左右されるだろう。 Q.国家コンソーシアムの計画と、そこでのフェアユースについてはどうなるのか。学術情報は本当に無料なのか。生情報に対して「編集」という手間が介在しているものも無料でいいのか。 A.西尾:課金する/しないの考えは、もともとの研究成果の出所にもよるのではないか。 二木:デジタルの世界では、付加価値が付いていても、無料というものがある。それは公開することに伴う別のメリットからそういう動きもある。課金するかどうかの判断は多様化するのではないか。 佐々木:編集したものに価値がある、と言う考え方は過去のものでは。今は「集合知」という考え方もある。パッケージからドキュメントの個人による再構成化もありえる。だから、必ず編集された情報がよいともいえないのでは。ただ、ノイズの中から必要な情報をどう掬いだすのか(検索エンジンの検索結果の1ページ目にどうでもいい情報があって、数ページ先に必要な情報がある場合など)は考えないといけない。 Q.情報のオリジナリティについて。全体の中で他の情報と同じ内容である場合や、個人が色々なところで同じような事を書いたりしている場合、将来的に圧縮されたりすることはないか。 A.西尾:学術論文などの場合、査読の段階で他と内容が同じであれば切られるのでは。査読は既出の情報であるかどうかを徹底的にチェックする。  二木:個人の中でダブりを減らすために新しいものを書こう、という考えも出てくるのでは。 Q.情報爆発について。Twitter(ネット上で「今何している」の呟きを書いていくツール。チャットとブログの中間的なもの)などは情報爆発の例になると思うが。個人の「つぶやき」までもがGoogleの検索に現在引っかかっている。伝えるためでなく、「自分の覚え」としてウェブを使う人が増えた場合、そういったものは「情報」になるのか? A.長尾:そういうことまで集めなくちゃいけないのか。と言われると「捨てる」ことも考えないといけない。情報爆発に耐えるにはどこまで集めるかは慎重に考えなくてはいけない。 西尾:そういったものを集めて何をするか。それを有効に使われることを考えていくことも必要。 佐々木:情報だけでなく「つながり」もインターネットの側面であり、そういった情報も実は大事じゃないのか。そういったものもマッシュアップすれば価値が出るのでは? Q.ではそういったライフログの保存が重要である一方、真面目な情報と同列にしてもいいのか。翻って、ウェブの発展があれば、箱としての図書館が要らない時代が来るのか。 A.情報のナビゲートをするスタッフが必要になるだろう(今はそういったスタッフが少ないが・・・)。図書館内でなく、外部のデジタルデータのナビゲータが必要にある(異分野に強くなる必要があり)。資料ではなく人材を活用していく図書館になる? メモに残っていたけども、質疑応答かパネリストのまとめ意見か分からないうえ、誰の発言かもわからないもの(質疑応答の最後の方の発言です) 専門図書館はe-サイエンスの基盤となるべきだが、今は圧倒的に資源が足りていない。ネット情報も著作権の登録方式を採ればよいのでは?そういう方法があれば「捨ててはいけない資料」もわかるのではないか。 「専門性」と「調べること」に加え、「編集能力」と「コミュニケーション能力」が今後司書に必要な資質になるだろう。 データベースのデータベース=メタデータベースを作る。もっとデータベースのユーザビリティを向上させていくことが求められるのでは。 感想 「図書館で扱う『情報』っていったいなんだろう」、そもそも「情報」ってなんだ?という根源的な問いに行き着くような示唆と知的刺激に富んだフォーラムでした。国会図書館長の話が聞けるだけでも貴重だよ。 皆が「図書館」で扱うものが今や「本」ではなくて、「情報」である、という前提に立った上で話をされているのが印象的。大学図書館では、それが今や標準的な考えなのでしょう。ゆくゆくは公共図書館もそういう方向にシフトしていくんじゃないか。その時に図書館員に求められるのは、「情報ナビゲータ」「アーカイブ編集者」としての役割であると言えそうです。