日本図書館情報学会誌
Online ISSN : 2432-4027
Print ISSN : 1344-8668
ISSN-L : 1344-8668
論文
深層ウェブの実態とその要因 : 機関リポジトリに登録された文献を用いた調査
宮田 洋輔安形 輝池内 淳石田 栄美上田 修一
著者情報
ジャーナル オープンアクセス

2012 年 58 巻 2 号 p. 97-109

詳細
抄録

ウェブの規模が増大するにつれ,検索エンジンからアクセスできない状態,すなわち深層ウェブも増大していることへの関心が高まっている。マッカウンら(2006)とハーゲドーンとサンテッリ(2008)は,深層ウェブの規模をOAI-PMHを用いて収集した機関リポジトリに収録された文献のメタデータを用いて計測した。本研究では,2009年9月に,先行研究の手法を応用し,日本の機関リポジトリから収集した全文PDFファイルのURLを用いて,より大規模に深層ウェブの比率を計測した。その結果,Google, Yahoo!, Bingの3つの検索エンジンから検索できるウェブは72.0%に過ぎず,28.0%が深層ウェブとなっていることが分かった。1つの検索エンジンでは,最高でもGoogleの53.2%であった。また,PDFファイルとURLの特徴の調査から,動的なURLや長いURLが深層ウェブとなる要因であることが分かった。

著者関連情報
© 2012 日本図書館情報学会
前の記事 次の記事
feedback
Top