您现在所在的位置:

首页 > 网站运营 > 搜索引擎优化 > 搜狗搜索:从识图搜索谈未来大势

搜狗搜索:从识图搜索谈未来大势

作者:付江 来源:中国电子商务研究中心   2011-08-30 10:08
    经过近半年的独立研发,搜狗搜索推出了识图搜索功能,即可通过上传图片等方式搜索找到相似群组图片和资料。日前,就这一新功能以及搜索领域热点话题,CSDN记者专访了搜狗公司搜索事业部总经理茹立云。
  搜狗公司搜索事业部总经理茹立云
  深度调研和数据挖掘用户需求
  CSDN记者:请谈谈搜狗做识图搜索功能的初衷是什么?
  搜狗公司搜索事业部总经理茹立云:主要基于用户需求的转变,包括两个层面。第一个层面是整个互联网技术都在提升,用户背后的需求一直得不到满足,以前大家搜索主要靠文字,随着时代的进步,媒介使用设备的更新,用户对基于图片、音频、视频等跨媒体搜索需求越来越大。比如说,在搜狗的搜索引擎里面,过去搜一张图片是谁,会有1000万以上的结果。到现在,更多用户不再满足于仅仅看到图片,而想了解图片背后的故事是什么。第二,随着新兴媒体的诞生,像微博,对识图搜索的需求越来越大,用户想知道要加的这个人是不是真实的那个人,包括北京下暴雨网上出现了大量通过PS出来的虚假图片,还有动车事故也有很多虚假的图片,广大网友难辨真伪,所以要增加辨别能力,识图技术就可以辨别事情的真伪。此外,我们也考虑到了搜狗的优势,识图能够更加便捷,搜狗通过跟浏览器结合,用户使用识图越来越方便。
  记者:当时开发识图搜索功能的时候搜狗团队内部有没有一些分歧?
  茹立云:初期做了比较多的调研,最主要的调研包括三个方面:1.首先是用户的潜在需求到底会有多大,这个我们对相关数据做了挖掘和分析;2.另外就是调研了识图或者图片相关技术,要支撑这么一个识图的产品在技术层面是不是成熟;3.同时现在用户使用的话是不是便捷,如何能够给用户提供更好的体验。通过调研,搜狗发现,一旦发现用户背后的需求非常巨大,做这么一个产品自然而然成为大家的共识。一开始讨论比较多的是用什么样的技术方案研发出来,并且能够很好的做好。但是对于这个功能,我们内部是一直看好的。
  记者:与Google推出的识图搜索功能相比如何?
  茹立云:搜狗的识图搜索跟Google比较有几个比较重大的创新,我们发现用户在之前的识图需求里面,除了想找到跟这张图片及文化一样的图片之外,很多同组的图片可能也是他感兴趣的,比如说搜一张搞笑的图片,能不能把其他的搞笑的图片搜在一起。搜狗已经不仅仅是基于图像的内容,同时把它文字上的含义,或者说它的语意结合在一起,找到同组合的图片,这是一个创新。第二块儿就是发现用户在使用识图的时候,如果单纯用一种网络服务的形式的话,使用环节会非常不便利,但是如果把它和浏览器很好的紧密结合在一起,使用识图的过程就变得特别简单了,随时随地都可以识图,不用像之前要记住这个网址,拷下来输进去。
  技术门槛较高在微博领域可发挥大作用
  记者:采访之前,我也找业界的人咨询了识图搜索技术,据说难度非常大。能否用通俗的语言解释一下技术上的实现方式?
  茹立云:搜狗识图主要包括以下几个技术:
  首先,图像有效特征的抽取。有一句话叫做“一图胜千言”,图片包含了大量的语意,是用各种各样的颜色、纹理特征表现,怎样能够找到一种有效地特征来描述,对图像压缩、变形、光照的变化都不会受它的影响,这些特征不是搜狗定的,这是里面比较困难的点,就是图像有效特征的抽取。
  其次,要抽取这个特征的话怎么把它理想化,一旦理想化之后才可能成为一种索引,否则就没有办法进行索引,后续的效力就没有办法得到保证。搜狗对识图效果的要求非常高,一张图在匹配这块儿要求在10秒以内把结果反馈回来,有效特征的表示是其中一大难点,以及怎么样建立一个索引。
  第三,去伪存真。有了大量跟当前图片类似的图片,怎么样从里面能够提取出表示这个图片含义的语意,现在中文互联网的情况比外文互联网的情况复杂很多,比如说很多明星的照片,比如说减肥,都会被网上盗用,怎么能够去伪存真,真正找到这张图对应的是谁。
  第四,搜狗做了同主题图片的识别。有别于之前一般的做法,仅仅根据图片的特征和语意,搜狗技术还用到了图片之间的链接关系,怎么样能够把这种链接的关系应用起来,同时提高识图的精度。
  记者:我们在图片上可能会存在一些关键字或敏感词,能否对这些关键词进行识别?
  茹立云:从技术上来讲,如果不是手写的话,印刷体内容的识别技术是非常成熟的,在90年代末的时候,OCR(Optical Character Recognition光学字符识别)的技术已经非常成熟,里面唯一有困难的是怎么样对图片进行切割。所以OCR的技术本身是非常成熟的,另外搜狗目前还没有应用,但是搜狗这块儿技术有储备,我们跟清华有联合实验室,在90年代末的时候基本上已经可以做到极致了。之前的四库全书的数字化已经做到了这个工作,现在我们会看到微博上有印刷体的图,印刷体的识别现在是非常成熟的技术。
  记者:现在微博上需要进行关键字审核,很多人可以先发内容,然后再截一张图下来。这样基于图的内容审核会比较麻烦。
  茹立云:对。这个不在于识图,在监控里面如果有这种需求,已经有非常成熟的技术,基本上国内的高校都有这样的技术。
  记者:搜狗的识图搜索技术在业内是什么样的水平?
  茹立云:之前我们也做过精度测试,都不逊于当前任何主流的识图产品,另外在信息的及时度上,当天出现的热点,当天能否搜索出来,搜狗可以当天搜索出来,但是我们看到其他的同类产品还不支持(到这个及时度)。图像这块儿搜狗在搜索引擎领域有7年的积累,在图像技术上不能说比别人一定强,但是不会比其他家落后,现在大概是这个情况。整个研发到最后推出与创新点结合在一起,速度非常迅速。
  任何有道德的公司都不会去触犯保护用户隐私的底线
  记者:网上有些图片是有所有权,搜狗识图是怎么处理的?
  茹立云:现在对于互联网来讲,图片搜索还没法辨别它是不是有所有权,什么人拥有这个所有权,要通过投诉的渠道。另外,会做一些比较敏感的图片的过滤。
  记者:如何看待识图搜索可能会涉及用户个人隐私的问题?
  茹立云:据现在的了解,之前也跟国内的图像权威人士做了比较多的交流,基于头像识别的技术,或者人脸识别的技术在开放性方面是不完备的,效果有待于进一步提升。首先在技术上这个门槛还没有跨越;其次就是保护层面,由于技术的不成熟,用人脸识别这种方式的话,本身这种担心是有必要的,但是也并不是非常有必要的事情。作为任何一家有社会责任的公司,推出任何可能涉及隐私产品的时候,一方面要多听一听公众的意见,都不会去侵犯这个底线,隐私是需要保护的。另外一方面需要通过一些技术手段或者其他一些手段能够保护用户的隐私。
  记者:但是普通的用户并不是很了解,他们就觉得隐私被侵犯了。
  茹立云:现在搜狗的识图搜索技术还不会用人脸识别的技术在里面。
  记者:您对目前搜索市场怎么看?尤其是国内,百度基本处于垄断地位,你对搜狗的未来是如何规划的?
  推荐和整合功能是关键
  茹立云:对搜索引擎市场来讲,其实现在还是处于蓬勃发展的阶段,无论是全球范围内还是中国范围内,市场的潜力还是非常巨大的,尤其是国内市场潜力更加巨大,主要是几方面。
  第一,国内的网民还在继续增长,不只在说PC端,无线端也在高速成长。
  第二,中国有2000万家中小企业,现在进行互联网营销的有20几万家,规模跟国际上比起来还小很多,整个中国的经济处于高速的发展中,互联网以及电子商务在不断地普及,从企业需要营销的方面来讲未来也会有很大的增长。整个行业处于比较好的发展时期,当然现在也面临一些问题,比如说搜索引擎在互联网上营销的控制可能是其中的一个问题,不能让一些虚假的广告伤害到用户,所以这也是大家尽力去解决的事情。
  具体到搜狗来说,里面的机会在于:
  第一,我们有跟客户端,浏览器有协同作战的做法,在用户入口方面有优势。
  第二,搜狗搜索有比较多的技术创新,像刚才提到的识图搜索,以及前期提到的全搜索技术。用户在使用搜索的时候更加便捷、全面、及时。通过入口的把握以及对产品的创新使得用户越来越多的用搜狗并且喜欢搜狗,这也是过去的一年我们为什么会这么快速成长的原因之一。
  另外,未来搜狗会更多的探索浏览器跟搜索结合的搜索模式,现在的搜索还是称作为第二代搜索,那么第三代搜索需要转变一种形式,不再像现在这样简单的关健词搜索,是一种无处不在的搜索,用户要看到一篇新闻的时候,搜索引擎可以告诉你背后是什么,给你推荐相关的内容,从整个互联网发展来讲,第一代是浏览器,第二代是搜索,第三代我们把它称为总推荐,其实是搜索的延伸。搜狗未来希望在这个领域做出比较大的创新性的产品出来,搜索不再像现在靠关健词做的搜索,可以把它称为探索式的搜索,用户看这篇文章背后的需求是什么,我可以告诉你进一步你想做的一些什么事情。
  记者:搜狗搜索跟浏览器整合,目前大概的进展是什么样的?
  茹立云:目前我们已经在做这个层面的整合,像识图功能通过跟浏览器结合,使得用户使用的便捷和体验有非常好的提升。另外,之前的消息盒子会做视频的推荐,比如说用户看过某一个连续剧,这是一个更新的连续剧,如果有新的出现的话,将第一时间推荐给你,不需要用户自己不停的搜索看看有没有新的,是这种推荐的概念。像音乐搜索,也会搜索页面上是不是存在一些应用,如果你感兴趣的直接就可以在页面上应用,会非常的便捷。未来像电子商务、软件、旅游酒店这块儿都会跟推荐引擎结合在一起。
  兴趣为先扎实基本功最重要
  记者:对于一些想进入搜索领域的学生或技术人士,您有什么建议?
  茹立云:想跨入搜索领域有很多种方式,本身跟搜索相关的领域要有特别全面的人才,比如说是一个技术人员的话,基本功一定要扎实,比如说编程基本功打好了,才能够做很多比较高深尖的技术。此外,还要选好入门搜索引擎领域的方向,如果本身对互联网的产品非常喜欢,就可以做跟产品相关的工作。如果对网民这块儿有感觉,跟他们联络有感觉,你就可以做产品应用的工作,搜索引擎这个行业出来的人才是多种多样的,关键是你是不是对这个感兴趣,只要感兴趣并且有基础,又为之去努力,做这个行业并不是太难的事情。
  记者:技术人员的基本功具体包括哪些部分?
  茹立云:这跟计算机科学的基础技术比较相关,比如说像操作系统、编程基础课程等等。你想在里面有更进一步的发展,最好还要会编程语言处理、自然语言处理、技术学识这些计算机领域的专长。
  备注:
  关于搜狗识图搜索:能实现以图搜图,即通过上传图片、鼠标拖拽、鼠标选图、输入图片URL地址等多种方式搜索,找到互联网上与这张图片相似的其他图片,并且利用图片识别技术,进一步分析图片内容的主题,找到与这张图片同主题的其他图片。
热点文章
  • 一比多网站:一比多一比多移动平台
  • 一比多咨询热线:13361975067   

    沪公网安备 31011502004088号

  • 增值电信业务经营许可证:沪B2-20070060 网站ICP备案号:沪ICP备07012688号 一比多(EBDoor) 版权所有 Copyright 1998-2018 EBDoor.com All rights reserved.