百度和Google谁更低俗
近日,谷歌可谓被低俗、色情内容搜索搞得焦头烂额。不过,21日就有网友在网易论坛发帖表示,经过自己的比较和分析,百度在搜索低俗、色情内容的能力,比起谷歌,是有过之而无不及。下面就看看网友"xi鄄ao4ever"的"报告",看看两者谁更低俗。
两大搜索网站谁更低俗
本文主要针对百度和Google搜索引擎的关键字过滤功能进行比较和分析。
虽然Google推出了专门针对中国国情的 “谷歌”(Google.cn),并使用了颇受争议的信息过滤技术,然而即使如此依旧无法摆脱被恶意攻击和诽谤的命运。
有报道攻击道:“最常用的信息过滤、屏蔽技术被称为‘关键字过滤’,这项技术为广大搜索引擎企业所掌握”。并声称“这项‘信息过滤’技术不算是特别复杂的技术”。
据我所知,谷歌和百度目前都对色情违法信息进行了过滤技术,不同的是,百度还增加了一项关键词屏蔽技术,就是对于一批敏感关键词,当服务器接收到用户提交的搜索词后,先将搜索词和上述“过滤词汇表”进行匹配对比;一旦匹配成功,服务器即返回“您输入的关键词可能涉及不符合相关法律法规的内容”,然后结束搜索。比如在百度搜索“色情”等词语后显示的效果。
然而,从技术上讲,这种“过滤词汇表”实际上有很大缺陷和漏洞,对于稍懂一点电脑知识的人来说形同虚设,例如在百度搜索“色情”的确不让搜索,但是搜索带引号的“色情”二字即可出现183万条搜索记录,远远多于谷歌搜索出的记录(另外提一下,我用谷歌搜索“色情”返回的结果是“该页无法显示”,不知道这个记者用什么线路上网的,莫非是百度提供的专线?)。推而广之,所有百度通过“过滤词汇表”屏蔽的词汇,大部分只要加上个引号就全都可以搜索,另外,将多个屏蔽关键字组合在一起也可以搜索出结果,更可笑的是,在百度不可以搜索“色情”,但却可以搜索出“色情图片”70万条记录,“色情电影”51万条记录,“色情小说”23万条记录,“色情网站”79万条记录,可见这种屏蔽的方法实在是用来忽悠媒体的,实际作用非常有限。
搜英文色情内容百度胜谷歌
其次,对于使用具体过滤技术来看,谷歌和百度都通过内容的相关性过滤掉色情违法网站,谷歌过滤是会在页面底部显示 “据当地法律法规和政策,部分搜索结果未予显示”。两者的过滤效果来看,搜索几个关键字即可感觉出来。
百度搜索“色情图片”,第一页的大多数是论坛上的文章,并有4、5条包含色情信息,而在谷歌搜索“色情图片”,则第一页没有一篇是色情信息。搜索其他的信息进行对比也可以发现谷歌的确在信息过滤上做了不少工作,而百度过滤的信息则远不如谷歌。更进一步,用百度和谷歌搜索英文,我们发现百度对于英文网站的过滤效果更差,用百度搜索“hardcore(中坚分子,绝对的,无条件的,没有限制的;赤裸裸描写性行为的)”,结果出现了170万条数据,可以打开查看到非常多的色情网站,而在谷歌中搜索“hardcore”只能搜索到288条结果。这个夸张的对比可以看出两者在过滤功能上所做的工作实在差距太大,所以,如果百度在这方面对谷歌进行指责攻击,那实在是颠倒黑白,指鹿为马。
谷歌输在“只做不说”
当然,这也反映出一个问题,百度是“只说不做”,而谷歌是“只做不说”,谷歌还以为配合中国进行信息过滤就可以顺利进入中国市场,其实百度在过滤上做的工作可能还不如谷歌的十分之一,但是百度却能让别人以为百度比谷歌做的多十倍。
当然,谷歌是个很值得敬佩的企业,在企业的价值观、道德观方面,谷歌坚持“你可以挣钱而不必做坏事”,在公司内部,每个人都努力成为“极具创新精神、值得信赖、行事正直,而且极大地改变了这个世界的人”。谷歌无论在管理领域还是在服务领域都顺应个人化、大众化、社会化的趋势,坚持“做正确的事情”。可能正是因为这一点,才使得目前谷歌在和百度的竞争中处于劣势。