2011/07/14

OR2011

第6回オープンリポジトリ年次国際会議(Open Repositories 2011)は、プレカンファレンスイベントを含めて、2011年6月6日から11日までの6日間、米国テキサス州オースティンにあるテキサス大学オースティン校、AT&T Conference Centerで行われた。今回の会議のテーマは、“Collaboration and Community: The Social Mechanics of Repository Systems”であり、リポジトリシステムの開発者、マネージャ、ユーザーが融合してソーシャルダイナミクスを生み出し、システムは持続的な成長を続けていくという意味が込められた。

プログラムチェアのTom Cramerによると、250以上の著者から160件の投稿があり、24件のジェネラルトラック論文、4ブロックの24x7(24件)、3件のパネル、36件のポスターが採択された。会議は、3日にわたるメインカンファレンスとともに、2日にわたるDSpace, ePrints, Fedoraのユーザーグループミーティング、2日にわたるワークショップ、チュートリアル、ワーキンググループミーティングで構成された。参加者登録人数は300人を超えた。

メインカンファレンスは中3日間で行われ、初めのオープニングプレナリーは、Apacheソフトウェア財団 (Apache Software Foundation)のPresidentであるJim Jagielskiによる講演であった。Jagielski氏はApache ソフトウェア財団の設立者の一人であり、コミッターを長年務めている。講演では、オープンソースについて、特にApacheソフトウェア財団の組織の構成と、オープンソースコミュニティの在り方についてスピーチされた。今ではオープンソースコミュニティそのものは開発スタイルとして一般に受け入れられるものとなっているが、健康な(Healthy)コミュニティこそが質の高いソフトウェアを生み出していると指摘していることは印象的であった。リポジトリソフトウェアの、特に、DSpaceやFedoraはオープンソースコミュニティによって開発されている典型であり、Apacheの開発スタイルを参考にすることは開発コミュニティそのものを持続していくうえで重要なことであろう。

Opening Plenary: Jim Jagielski, President, Apache Software Foundation

Slide title of the Jagielski’s talk

Audiences for the opening plenary speech

続けて、2つのパラレルトラックに分かれて、ジェネラルセッションが行われた。初日のセッションのテーマは、セマンティックWebとLinked Data、クラウドソリューション、SWORD、識別子とオーソリティであった。2日目のセッションのテーマは、大規模な保存とアクセス、プラットフォームの進化、よりよい学術コミュニケーション、コラボレーションフレームワーク開発、リポジトリサービスへのコミュニティ参画、データ共有と再利用、ソーシャルネットワーク、国の視点とアプローチ、であった。また、今回から24x7という24枚のスライドで7分間発表するという形式のセッションが新設された。従来のポスターセッションとジェネラルセッションの中間に位置するセッションである。これも、ジェネラルセッションと混ざって2つのパラレルトラックに分かれて行われた。テーマは、福袋(Grab Bag)-今までとは全く違うもの、コミュニティ、ツール、であった。

ジェネラルセッションの発表の中で、筆者に関係の深い著者識別子関係の3件の発表に触れる。1件目は、ANDS(Australian National Data Service)の支援を受けて実施された、オーストラリアのサウザン・クイーンズラインド大学と、ニューキャッスル大学、スウィンバーン工科大学と発表者Peter Sefton、Duncan Dickinsonらソフトウェア開発者の共同による、オーソリティコントロールサービスMintである。彼らはもともとデータのリポジトリを持っており、セマンティックWebを作り上げるにはそれらのデータに対してそれぞれリンクをしなければならないという認識の下、たとえば著者のIDや統制された語彙をリンク先としてサービスするシステムを考案している。Mintは、語彙と名前をスプレッドシートや、SKOS、スクリプトを介して簡単にインポートし、また、内容をJSONで返却するルックアップサービスを備える。2件目は、MITのRichard RodgersによるORCIDの紹介である。ORCIDのシステムは、学術関連の著者IDの公開レジストリとして紹介された。開発のタイムラインとしては、2011年中にプロダクションシステムのベータ版を構築し、2012年初頭から一般の登録を開始するということであった。また、図書館サイドのワークフローを付け加え、自組織の研究者のパブリケーションを研究者のIDに結び付ける作業を80パーセント自動で、20パーセント手動で行うことを示した。3件目は、香港大学のDavid Palmerによる、The HKU Scholars Hubの紹介である。これは香港大学の研究者ディレクトリであり、研究業績として出版リスト、指導した学生のリスト、研究助成、ビブリオメトリクスが表示される。表示内容は細かく入力可能であり、表示設定できるようになっている。概してよく作りこまれている。特にビブリオメトリクスは外部サービスのIDをもとに引用している点が目を惹く。Scopus, BiomedExperts, PubMed, ResearcherID, Microsoft Academic Search, Google Scholarである。

Coffee break: everyone talk each other outside of the main hall

初日の最後は、ポスターレセプションである。ポスターレセプションでは、ポスター会場に用意されたワインやビールなどのお酒を片手に、興味のあるポスター展示の前でポスター発表者と気軽に議論できるようになっている。ポスターレセプションに先立って、ポスター1件当たり1分間の説明時間が割り当てられるMinutes Madnessと呼ばれる一大セッションがある。ここでは壇上に順番に発表者が並んで、総勢36人の説明が矢継ぎ早に繰り広げられる。興味のあるポスターをここで探すというわけである。筆者はここのポスター発表に採択されたので1分スピーチを行った。筆者は、Web上の日本の研究者の著者名典拠として研究者リゾルバー(Researcher Name Resolver)を開発しており、ポスターではこれを用いて、日本の機関リポジトリポータルであるJAIROにおいて正確な著者名検索を実現するフレームワークを紹介した。ポスター会場では、テーマが適時だったためか、多くの参加者とコミュニケーションをとることができた。写真は筆者のポスターを映し出している。

My poster presentation in the poster room

2日目の後半は、ディベロッパーチャレンジという、お題は1か月前に与えられるが、カンファレンス開催期間内にも特別に用意された部屋で最後まで開発して、参加者の前に披露するセッションがある。今回のお題は「未来のリポジトリを見せる」であった。写真はデモンストレーションの場面である。開発者コミュニティを育てる企画であり、発表後は会場にいる人たちの拍手でまるでテレビ番組のようにその時の点数が決められる。ただし、その後のレセプションで表彰される優勝者は必ずしも拍手の点数で決められたわけではなく、本質的に有用だと思われる機能を紹介したチームであった。審査員は実務的観点からアイディアを見ているのだろう。

A scene in the developer challenge

3日目の朝は、クロージングプレナリである。締めくくりにふさわしく、学術コミュニケーション技術のオピニオンリーダーであるCNI(Coalition for Networked Information)のClifford Lynchであった。彼は「Repositories: Major Progress and Open Questions」というタイトルでリポジトリの今を概観した。リポジトリに関するディスカッションはどこまで達成したか。まず一つは、一連のクリティカルディスカッションのフォーカスポイントを提供してきたことがあげられる。2つ目は、IRが様々な人たちを含んだコラボレーションのフォーカルポイントとなったことである。この2つは、学術コミュニケーションのランドスケープを変えるほどに達成したことであるという。

続けて、Lynchはまだ答えのない問題が残っていると指摘する。IRだけでなく出版全体の名前典拠の問題、IRメタデータ&発見サービスの問題。また、観察によると、IRとそれをとりまく学術システムの発展の仕方はばらばらであること。学習管理システム(LMS: Learning Management Systems)はいまどこにでもあるが、IRとの関係は不明。講義キャプチャシステム(Lecture Capture Systems)は、LMSより有用だが、どうしてキャプチャするのかという議論がなく、IRとの関係も不明。また、よくわからないのは、IRがワークフローに手をどこまで伸ばしていくか。大きくなったデータセットをどうするかも問題。最後に、バーチャル組織はIRを使うとして、組織が終了したらどうなるのかということ。また、長期的な責任問題として機関にどうマップするのか。他には、ソフトウェア。これは多くの関心を集積したものであり、データの再利用は難しい。それらを使った結果の出所がはっきりしない。そういうソフトウェアをリポジトリがどう扱うか。リタイヤした教員のリポジトリコンテンツ、大学を超えたIRの再解釈、などである。

最後は、オープンイッシューについて触れた。保存に関するアイディア。単一障害点を取り除く地理を考慮したコピー。異なる機関で重複したプリントを持つなどが考えられる。長期的保存について機関がコミットする意思があるかどうかを確認し、なければ別の機関へ手渡す必要もある。また、これからの話として増えていくコレクションをどうするか。機関と社会との関係の再考をしていく必要があるという。IRは単独では存在しえないからとうことだ。

Lynchのリポジトリを取り巻く考察を、聴衆は次の課題としてとらえられたに違いない。

Closing Plenary: Clifford Lynch (Coalition for Networked Information)

メインカンファレンスが終了すると、続けてDSpace、Fedora、EPrintsのユーザーグループミーティングが始まった。45件ほどの発表が複数の会場で2日間続く。

筆者はDSpaceを中心にして参加した。ここでの印象は、DSpaceはコミュニティを重視しているということである。コミュニティを盛り上げていくことが、DSpaceというシステムを継続して発展させていく原動力であるということだ。写真はSandy PayetteがDuraspaceの歴史を振り返る一コマである。彼女は近々学位を取るということで、あたかもDuraspaceの活動を卒業するかのような発言が見られた。

Sandy Payette in the Duraspace User Group Meeting

これでOR2011は終了する。しかし、順番は前後してしまうが、プレカンファレンスミーティングを付け加えてぜひ紹介したい。プレカンファレンスミーティングは、メインカンファレンスの前日に2日間にわたって行われた。リポジトリに関係のあるグループが普段Face to Faceで議論できないメンバーが集まって活動する場として企画される側面もある。リポジトリ関連企業が社内の活動や宣伝を兼ねてセミナーを開くものもある。

筆者はDSpaceの開発者ミーティングに参加したのでそれについて紹介する。実は、このDSpaceの開発者ミーティングこそがリポジトリ開発の真髄ではないかと思うような熱気がここにはあった。朝から夕方までほぼ一日、Lead DeveloperのTim Donohueの司会の下、30人ほどの参加者が日頃のネット上での議論を交わしている。多くの参加者は、普段DSpaceの運用マネージャでありアドバイザーで構成されるDCAT(DSpace Community Advisory Team)と、開発コミッターである。

ここでは、これからのDSpaceはどうあるべきかについて網羅的にブレインストーミングが行われた。実務の延長としての機能を全員で列挙していった。また、それとは別に、より具体的なことを決議していく。時期リリースとしてDSpace1.8.0の機能について担当者を明確にしながら確定し、また、バージョンナンバリングスキームについてディスカッションした。さらに、Google Summer of Code、Fedora Inside、 DSpace1.8.0のプランニングについて報告された。Google Summer of Codeの事例はDSpaceがプログラミング教育に使われていることが見て取れる。写真はミーティングの様子を示している。

DSpace developer meeting: hot discussion enthusiast together

その他にも、マイクロソフトリサーチの活動の紹介や、Fedora、Hydra、Curation TaskについてのBOFなど15コマほど用意されていた。

今回のOpen Repositoriesも昨年同様大変な熱気に包まれて、有意義な経験ができた。ここでは生きたリポジトリ開発、ひいてはWeb上の学術コミュニケーションシステム構築へのエネルギーが渦巻いている。年に一回の充電をここでするのはよいことだと思う。





おまけ。会場近くのテキサス州議会議事堂。そびえたっていました。

Texas State Capitol: standing on the ground

0 件のコメント: