2006年12月5日星期二

百度欺骗??

看到留园6park一篇文章"百度夸大搜索结果被指作弊,面临信任危机",我在下面做了转贴. 于是我到百度做了两个实验:

1) 搜索"site: myweb.dal.ca/jliao", 结果显示"百度一下,找到相关网页20篇,用时0.001秒",离真实文章量很相近.

2) 搜索"site: ivyliao.spaces.live.com/",结果显示有1030多条, 一共有11页.但是当我click到第3页,结果又只显示有28篇,而且后面的8页全部不见了.

这是技术欺骗还是bug就不得而知了. 但是经过我自己实验后,就知道这不是诬蔑了.

以下是文章的转贴

=======================================


百度夸大搜索结果被指作弊 面临信任危机


新闻来源: 文汇报 于December 05, 2006 12:18:29

  网络的发展日新月异,在搜索引擎上输入一个查询词,不到0.001秒就能得到成数以千计的搜索结果。更短的时间内搜索到更多数量的网页内容,已经成为网民衡量搜索引擎是否出色的标准之一。

  但最近有些网民发现,某些搜索引擎通过数字游戏为搜索结果大量“注水”,通过夸大搜索结果数量,在表面上制造了搜索引擎搜索功能强大的虚假现象。

  站长的意外发现

  对于动辄上万的搜索结果而言,很少有网民怀疑过其真实程度,因为即便1秒钟点1个链接,点完10000个链接,也几乎需要3个小时。但最近一些网民却通过一些特殊的方法,发现了搜索引擎夸大搜索结果的内幕。

  一位网站站长在博客上曝料:利用百度搜索(Site: www.qicaispace.net)等关键字,可以发现百度显示收录单个网站的网页数量与实际情况存在较大差距。

  这位站长说,“我的网站我清楚,实际上的页面数量绝对没有这么多。大概只有1000多页。可为什么百度出来的结果会如此之大?难道百度为了显示自己的搜索力量的强大吗?或者,根本就是一个BUG?或者又有什么不可告人的阴谋?”

  记者亲自做了尝试,选择搜索(Site: www.lunwente.com),搜索结果上亦然写着“百度一下,找到相关网页863篇”,当记者翻到搜索结果的第2页就已经到了最后一页。其结果也写着“百度一下,找到相关网页17篇”

  CSDN一位网友特地进行了一个统计,随机选择了417个网站进行统计,发现平均搜索结果夸大比例在10-30倍之间,这实在令人深思。

  百度涉嫌技术作弊

  “这大概有两种可能性:搜索引擎的技术存在缺陷,或者故意误导消费者。” 互联网实验室高级咨询顾问王楠这样表示。

  这位人士称,普通的查询词,一般搜索结果都在几千到几万条,而搜索引擎只显示几十页就截断了。同时,由于普通用户不会点击那么多页,所以搜索引擎比较容易在搜索结果的数量上作假.

  记者同样将(Site:www.qicaispace.net)输入Google和雅虎,结果Google返回约862条相符的结果,雅虎返回约1020 条结果。经过记者亲自检查,其显示的结果数在误差范围内更尊重真实结果。而记者分别利用百度、Google、雅虎,检查其在www.yttang.netwww.zvtt.com等网站抓取的网页,也印证了这一发现。

  此外,有用户反映,百度在网站抓取数量上也存在的误导现象。例如输入“康师傅私房牛肉面馆”,显示返回结果1770条,翻页面可以发现,去掉重复的显示结果只有100条左右。相对而言, Google、Yahoo返回的结果则是去掉重复页面的结果,并没有“故意夸大”之嫌。这让用户觉得缺乏统一的规范。

  搜索面临信任危机

  “百度在多数网站的收录结果中都存在灌水现象,整体网页搜索结果的数量也一定存在问题。”一些网友这样认为。搜索引擎的结果灌水现象正引来信任危机。

  中国电子商务法律网首席信息官张晔认为,这要看现象背后的真实原因。如果是技术层面的原因导致的,涉及一些搜索结果的处理不当;如果是主观的夸大,则涉嫌不正当竞争。

  据悉,在传统行业,例如医药、快速消费品等领域,不当宣传的现象已经引起社会各界的广泛关注,严重的情况将被相关部门处以巨额的罚款。

  互联网作为新生事物,实践先于立法,目前还没有相关法律法规约束这一类现象。
发表评论