查找中文网站的昨日容颜

我们介绍过一个网站,在那里可以搜索出一个网站在历史中的某一天的样子,当时举的例子是1998年12月2日的google首页的样子。不过这个网站对中文网站的历史网页支持不好。这个叫作“中国web信息博物馆”的网站可以帮助我们查找中文网站的历史容貌。

这个网站可以说是“此马来头大”,看看它的介绍:“中国Web信息博物馆是在国家 973和985项目支持下,北京大学网络实验室开发建设的中国网页历史信息存储与展示系统。目前已经维护有30亿以中文为主的网页,并以平均每月四千五百万网页的速度扩大规模。”

使用非常简单,在搜索框内输入想要查看的网址就行了,它支持二级域名,比如news.sohu.com,不过news.sina.com则没有搜索结果,不知道为什么。

我试了几个网站,最早的网页显示的时间都是2002年1月18日,看来系统是从这一天才开始抓取网页的。而且02、03、04年的网页资料在时间上很多是不连续的。有趣的是,虽然网页最早显示的是2002年1月18日,可是网页本身的日期可能更早一些,比如刚刚提到的news.sohu.com,下面是截图,显示的是2002年1月4日。

sohu-news

(消息来源:趣站集

相关文章

  • 暂时没有相关文章

Discussion Area - Leave a Comment




  • Partner links