2013/04/08

JAIRO 著者検索

日本国内の機関リポジトリで公開されたコンテンツを横断検索可能なポータルJAIROに対し、ユーザーインターフェースを見直し、著者識別子で検索する機能を追加し2013年3月22日に公開した。ここでは、追加した著者識別子で検索する機能を紹介する。
--------------------

学術論文などのコンテンツを検索する際、コンテンツのキーワードを検索条件として検索結果を得るのが最も一般的な手順である。一方で、コンテンツの作者を指定して検索することもあるであろう。論文を例にとれば、論文に記述された知識をキーワードをたよりに検索し、知識の関連性を確認しながら読み進めていくことになる。論文どうしの引用関係をたよりに論文をたどっていくこともある。論文の重要性が被引用の数として現れるからである。そして、時々、論文の著者を指定して検索する。論文の著者を指定することで、ある研究者がもたらした研究の発展の方向をたよりに知識の展開を確認できるからである。

著者を指定して検索する時、著者名を検索条件に指定することがまず思い浮かぶ。しかし、名前には曖昧性の問題(Name Disambiguity Problem)があるため、この方法では十分でないことがわかる。それは以下のような理由による。論文の著者の中には同姓同名の異人が存在し、母集団の規模が大きければ大きいほどその割合が増える[蔵川, 2009]。また、研究者は婚姻を境に本名を変更した時、論文に記載する名前を追従して変更する場合もあるし、旧姓のまま記載続ける場合もある。論文が欧文雑誌に掲載される場合は、日本人を含めた漢字圏の研究者は漢字名を翻字に変えてアルファベット表記する。アルファベット表記の名前は、姓名表記の大文字小文字、省略形を雑誌によって指定される場合があり、表記が揺れる。

このような名前の曖昧性の問題を解決する方法は、著者に識別子を付与することである。論文の著者に識別子を付与するタイミングとしては、既に出版された論文の著者に識別子を付ける場合と論文の発表と同時に著者に識別子を付ける場合とがある。識別子を付与する方法は、計算機によって自動で処理する方法と人手によって付与する方法がある。機関リポジトリでは、既に出版された論文を機関リポジトリに掲載するタイミングで、人手で書誌のメタデータを作成する際に著者名を記述しつつ著者識別子を付与していく。

日本の機関リポジトリを対象とした横断検索ポータルJAIROで著者検索を実現するためには、JAIRO全体で一意に指定された整合性のある著者識別子が著者に付与されている必要がある。JAIROは著者識別子に研究者リゾルバーの提供する研究者識別子を用いる[Kurakawa, 2012]。

JAIROは著者フィールドに著者識別子が付与されたメタデータを機関リポジトリから収集する。もっとも簡便なケースは、以下のようにメタデータの著者識別子属性(creatorフィールドのid属性)に研究者リゾルバーの研究者URIが挿入される場合である。このためには、機関リポジトリの担当者はメタデータの著者フィールドに研究者リゾルバーの識別子を紐づけ、junii2のメタデータフォーマットのcreatorフィールドにid属性を付加して識別子をURI形式でメタデータ出力するようにクロスウォークを設定しさえすればよい。研究者リゾルバーの識別子は、科研費データベースKAKENに掲載された8桁数字の研究者番号を再利用して構成しているため、科研費の研究者番号を著者の識別子として利用している機関リポジトリでは、クロスウォークで8桁数字の先頭に”10000”の5桁の数字を付加して研究者リゾルバーの研究者URIに変換してid属性に挿入すればよいということになる。

 <?xml version="1.0" encoding="UTF-8" ?>  
 <OAI-PMH   
  xmlns="http://www.openarchives.org/OAI/2.0/"   
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"   
  xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">  
  <responseDate>2011-05-26T13:34:09Z</responseDate>  
  <request metadataPrefix="junii2" verb="GetRecord" identifier="oai:ir.lib.shizuoka.ac.jp:10297/5644">http://ir.lib.shizuoka.ac.jp/dspace-oai/request</request>  
  <GetRecord>  
   <record>  
    <header>  
     <identifier>oai:ir.lib.shizuoka.ac.jp:10297/5644</identifier>  
     <datestamp>2011-05-22T08:02:22Z</datestamp>  
     <setSpec>hdl_10297_24</setSpec>  
    </header>  
    <metadata>  
     <junii2   
      xmlns="http://irdb.nii.ac.jp/oai"   
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"   
      xsi:schemaLocation="http://irdb.nii.ac.jp/oai http://irdb.nii.ac.jp/oai/junii2.xsd">  
      <title>Orientation-dependent epitaxial growth of GaAs by current-controlled liquid phase epitaxy</title>  
      <creator>Mouleeswaran, D.</creator>  
      <creator id=“http://rns.nii.ac.jp/nr/1000001133354”>Koyama, T.</creator>  
      <creator id=“http://rns.nii.ac.jp/nr/1000048520242”>Hayakawa, Yasuhiro</creator>  
      <NDC>459</NDC>   
      <description>The orientation dependence of the selective epitaxial growth of Gallium Arsenide (GaAs) has been investigated to achieve a thick epitaxial layer for application to X-ray detectors. Selective epitaxial growth was carried out on patterned GaAs with [0 1 1], [0 1 2], [0 1 0], [0 1 −2], [0 1 −1] and their equivalent seed orientations by current-controlled liquid phase epitaxy (CCLPE). SiO2 was used as a mask layer to fabricate the various seed orientations on the Si-doped GaAs (1 0 0) substrate and various growth periods and current densities were considered. Solute transport in the solution was enhanced by the electromigration of solute by an applied DC electric current, which caused an incremental growth in vertical and lateral directions in all orientations. The highest vertical thickness of 268 μm in the [0 1 −1] orientation and the largest lateral growth of 318 μm in the [0 1 2] orientation were achieved at 7.5 A cm−2 current density for 6 h. The seed aligned in the [0 1 2] orientation was favorable for high lateral growth of GaAs. The [0 1 1], [0 1 0] and [0 1 −2] seed orientations were suitable for application in a GaAs X-ray detector.</description>  
      <publisher>Elsevier</publisher>  
      <NIItype>Journal Article</NIItype>  
      <format>application/pdf</format>  
      <URI>http://hdl.handle.net/10297/5644</URI>  
      <fullTextURL>http://ir.lib.shizuoka.ac.jp/bitstream/10297/5644/1/110520001.pdf</fullTextURL>  
      <jtitle>Journal of Crystal Growth</jtitle>  
      <issn>00220248</issn>  
      <NCID>AA00696341</NCID>  
      <volume>321</volume>   
      <issue>1</issue>  
      <spage>85</spage>  
      <epage>90</epage>  
      <dateofissued>2011-04-15</dateofissued>  
      <language>eng</language>  
      <doi>info:doi/10.1016/j.jcrysgro.2011.02.026</doi>  
      <rights>Copyright © 2011 Elsevier B.V. All rights reserved.</rights>  
      <textversion>author</textversion>  
     </junii2>  
    </metadata>  
   </record>  
  </GetRecord>  
 </OAI-PMH>  


機関リポジトリを運営する組織によっては、独自の著者識別子を付与したい場合も考えられる。研究者リゾルバーは、このようなケースにも対処できるよう、研究者リゾルバーの研究者識別子と組織ごとに付与した著者識別子の対応表を保持する仕組みを備えている。この対応表を作るためのアプローチはいくつか考えうるが、ここでは説明を簡単にするためにあえて述べないことにする。

JAIROは、著者識別子という新たな基礎を獲得することで、厳密な著者検索を可能とし、従来とは異なるユーザーエクスペリエンスを提供できるようになる。

JAIROのトップページの詳細検索画面を図1に示す。ここでの特徴は、著者名フィールドに著者識別子を指定して検索できることである。著者識別子は、研究者リゾルバーの13桁数字の識別子である。ここでは、図2に示すように、著者名の一部を入力することで、JAIROに既に登録されたコンテンツの著者名が識別子とともにサジェストされる。図では、「佐藤」と入力したときのサジェストの様子が示されている。各行には、「姓,名(13桁番号)」の形式が上位に示され、続けて、識別子のない姓名表記が続く。ここから、たとえば「"/佐藤, 伸一(1000020215792)/"」さんを選択すれば、図3に示すように、その著者のリポジトリコンテンツを検索結果一覧に得ることができる。複数の機関リポジトリから収集したメタデータには一意に著者の識別子が付与されるため、結果として機関リポジトリを横断した著者検索が可能である。例では、長崎大学と金沢大学のリポジトリの双方に論文が登録されている様子が見て取れる。また、図4に示すように、該当する姓名表記が表記の形式を問わずハイライトされることも取り上げるべき特徴であろう。

図1 JAIROの詳細検索画面 

図2 著者名を入力して識別子付でサジェストされる

図3 ある著者(研究者リゾルバーの識別子)で検索した結果一覧

図4 漢字姓名とローマ字姓名が混在してハイライトされる

著者識別子によって厳密にある著者の検索結果一覧を得ることで、検索結果に対するいくつかのフィルターが意味を持つことになる。著者識別子を指定した場合の検索結果一覧は、特別に「資料種別」と「機関」による分類表示を可能とする。図5に示すように、検索結果件数が表示された帯の右側にプルダウンメニューからフィルターしたい分類を選択できる。ある研究者はどのような資料をどのぐらいの割合で機関リポジトリにデポジットしたのか、どの機関リポジトリにいくつのコンテンツをデポジットしたのかを知ることができる。これによって機関リポジトリ特有の、資料種別や機関という枠組みを意識してオープンアクセスへの貢献度を測ることができるようになる。図6に資料種別を選択する様子、図7に機関を選択する様子を示す。

図5 著者検索によって検索結果一覧を得たときに、分類表示が可能となる

図6 著者検索によって検索結果一覧を得た後、資料種別によって分類表示する

図7 著者検索によって検索結果一覧を得た後、機関によって分類表示する

検索結果一覧で、スニペットの鮮やかな青色で表示された著者名は識別子によって区別されていることを示しており、クリックするとその著者の識別子で再検索される。機関リポジトリの担当者は、自らの機関リポジトリで公開するコンテンツの著者に識別子を付与することによって、JAIRO上の表示にこのような変化が現れることを体感できる。

検索結果一覧から、一つのアイテムを選択してクリックすれば書誌ページへ遷移する。書誌ページでは、論文の内容がわかりやすいようにレイアウトされており、コンテンツを起点としたいくつかの機能を配置している。その一つは、図8に示すように、著者名の右側に研究者リゾルバーへのリンク(研究者リゾルバーのアイコン)である。ここをクリックすれば、当該研究者の研究者リゾルバーのページへ遷移し、そこから、たとえば科研費データベースKAKENの当該研究者のページへ遷移する。図の例では、研究者が確かに金沢大学と長崎大学に属していたことがわかる。

図8 JAIROの書誌ページ上の著者名の右側にある研究者リゾルバーアイコンをクリックして、研究者リゾルバー、およびKAKENへ遷移する

著者識別子が付与された研究者だけが正確に検索結果一覧に表示され、著者識別子固有の意味のあるユーザーエクスペリエンスとともにコンテンツがオープンアクセスで公開される。JAIROにメタデータをハーベストされる機関リポジトリでは、ぜひ著者識別子を付与して著者検索の機能を体験してほしい。

謝辞
JAIROの著者検索機能の実現にあたっては、金沢大学、静岡大学、関西学院大学、奈良女子大学、長崎大学、北海道大学、大阪市立大学の各リポジトリ担当者の協力を得た。また、NIIのリポジトリ担当、および開発支援者、およびJAIROならびに関連システムの開発者の協力を得た。これらの関係者にこの場を借りて感謝申し上げたい。

参考文献
[蔵川, 2009] 蔵川圭,武田英明,高久雅生,相澤彰子,研究者リゾルバーαの同姓同名推定モデルと実データによる分析,「大規模データ・リンケージ,データマイニングと統計手法」研究会; 東京, 統計数理研究所; 10p. (2009-10)
[Kurakawa, 2012] Kei Kurakawa, Hideaki Takeda, Ryo Shiozaki, Shun Morimoto, Hideki Uchijima, Researcher Identifiers and National Federated Search Portal for Japanese Institutional Repositories, The 7th International Conference on Open Repositories (OR2012), Edinburgh, UK, July 9-13, 2012