如何付款 | 地理位置 | 帮助中心
 
 
 
互联网到底有多大?雅虎、Google各执一词
网络  发表时间 2005-11-25

        WWW到底有多大,很多互联网工程师都把这个问题归结到那种类似于针尖上可以有多少个天使跳舞这种令人费解的哲学问题上。但是在上周在美国圣塔克莱拉举行的互联网搜索引擎会议上,Yahoo声称其搜索引擎索引达到192亿后(译者注:搜索引擎索引可以通过对数据库进行定位来计算出数据库内文档数量),引发了一场激烈的讨论。

因为这个数字是Yahoo的邻居同时也是他最强劲的竞争对手——Google所提供数字的两倍多(81亿),于是这个仅仅是在Yahoo公司Web日志中简要提及的数字却引来一场口水大战,因为Google对其竞争对手计算索引方式表示质疑。

Sergey Brin,Google的创始人之一,认为Yahoo的索引之所以庞大是因为他对副本条目(duplicate entries)进行了计算,所以索引规格尽管很大但是没有效率。

但是来自Yahoo的高层官员们坚持他们早先的声明,他们说这个数字是准确无误的。他们表示,任何一个搜索引擎应该用真实的Web页来计算索引,这样才能对用户一个真实的查询请求响应返回的一个惟一确定的结果,我们公布的索引总数就是用这种方法来获得的。Jeff Weiner,来自Yahoo搜索和市场部的资深副总裁说:“我们对我们搜索工程师和科学家的成就感到骄傲,并且希望能为我们的用户提供世界一流的搜索体验。”

互联网搜索引擎的规格,因其能间接的反映互联网的大小,长时间来一直是计算科学领域研究和讨论的热点话题。主流的商业搜索引擎采用一种称之为Web crawlers的软件程序来对互联网进行系统扫描并对其进行索引。

索引本身也是维系计算机数据的核心机密数据结构,他可以使搜索引擎在Web用户输入一个关键词后返回成百上千的结果。

近日,在国家超级计算应用中心(National Center for Supercomputer Applications)的研究学者们企图用大规模的随机搜索对双方的搜索引擎进行测试来澄清这场辩论。 他们一共运行了100012个查询,结果Google返回查询结果平均比Yahoo的多166.9%. 其中只在3%的搜索请求中,Yahoo的搜索引擎返回的结果比Google多,因此他们认为Yahoo的索引声明是确实有些可疑。

Christopher Manning,一位在斯坦福大学大学讲授信息检索课程的教授对此评价说,“这种让索引数字的大小成为一个政治和商业问题争论的做法实在有点蠢。”

尽管搜索引擎所采用的算法是一个商业机密,但其他搜索引擎专家仍然对两大搜索巨头估计Web大小的能力和他们搜索引擎相关的索引规格表示怀疑。Raul Valdes-Perez,Vivisimo的首席执行官说:“我没有更好的办法来对其进行检查,这有点像哈佛大学和耶鲁大学决定比较谁的图书馆一样藏书最多一样。”

关键词:互联网、雅虎、Google

 

-->更多相关新闻
版权所有©2005 上海巧创网络技术有限公司 沪 ICP 备 05001802 号
网络实名: 上海网站建设上海网络公司上海仓存管理软件 电话: 021-50757260 50769776 50758883 传真: 50757260-14
地址:上海市浦东枣庄路 683 号(金杨经济服务中心) 6 楼 邮编 :201206 E-mail:webmaster@soeasy.cn