斯科特•霍夫曼:你或许就是Google试验的一部分
导语:他们常常得意地对人说的一句话是:“我们对算法的实时更新和改进,就好比是在万米高空为飞机更换引擎一样”。

经济观察网 张琪 北京报道

有人曾问当时还是Google首席执行官的埃里克·施密特(Eric Schmidt)这样一个问题:Google是否正使自己陷于“创新者的窘境”——过于关注对现有产品的小修小改而忽略了颠覆式创新,因为它的搜索技术实在是太强大了以至于到目前为止,竞争对手仍无机会威胁其绝对领先的地位?

“我认为‘创新者的窘境’把问题过于简单化了。你不能完全丢弃现有的系统,也没有必要这么做,因为它很好用。” 施密特说,“而且,我们的文化偏爱创新,我们知道未来仍有很大改进空间,所以我们叫人去把它们找出来。 ”

斯科特•霍夫曼(Scott Huffman)就是一个负责“找”出改进的人。他是Google高度神秘的“搜索质量团队”(search quality group)的关键人物之一,负责领导搜索质量评估和移动搜索小组。在“搜索质量团队”中,还有核心排名小组以及反垃圾小组。每个星期二,斯科特都要和其他小组的成员们聚在一起开会,用那个永远不变的话题互相折磨:如何改进Google搜索引擎的搜索结果。

1997年的Google搜索界面

也许在很多人心目中,Google搜索多年来看上去并没有太大变化。但是对于Google的工程师来说,Google搜索甚至每分每秒都在变化。他们常常得意地对人说的一句话是:“我们对算法的实时更新和改进,就好比是在万米高空为飞机更换引擎一样”。显然,“搜索质量团队”的天才工程师们就是为这架飞机换引擎的机械师。

2012年的Goolge搜索界面

“搜索质量团队”的工作流程一般这样开始:有用户向技术支持部门抱怨使用体验不好,或者系统自动收集到的信息表明用户对某些搜索结果的点击同以往相比发生异常,再或者是工程师们在头脑风暴时产生了新的灵感,无论哪一种,据此提出的改进方案最终都会被反馈到核心排名小组的负责人Amit Singhal那里,他会让手下的工程师们在内部网络上进行模拟试验,一旦他们认为问题得到解决,就会将方案发到斯科特的小组,即搜索质量评估小组。后者会对这些方案进行更加严格的测试,以确保不会损害其他的搜索结果。

访谈:

问:和十年前相比,Google搜索引擎主要变化有哪些?
      斯科特:首先在十年之前,我们搜索一个东西得到的结果看起来可能和今天的完全不一样。以前,搜索结果只是一个网页链接,但今天我们得到的结果内容非常丰富,包括网页链接、相应的图片、视频、地图等。这其实是整合搜索。第二个变化是快速回答的功能,在输入搜索内容之后用户直接能够得到答案。比如搜索“北京天气”或者是某一个航班号,Google可以直接给出答案,而不是链接到一系列无关的网页上。第三是在用户体验方面的改进。比如在用户输入搜索请求时,搜索框中就会给出一些实时的建议,搜索结果也是实时变化。现在还可以通过语音或图片的方式来进行搜索,这也是过去所没有的。此外,Google搜索引擎本身也在不断改进,比如更好的排名搜索结果,我们每年年初和年末都会做一个比较,看一年中搜索结果发生的变化,有的时候变化能达到20%-30%,变化非常大。

问:搜索结果如何才能做到与用户最相关呢?
      斯科特:我们用几百个指标来衡量结果并进行排名,最后的目的是给用户呈现相关度最高和质量最高的搜索结果和文件。比如我们会考量这个关键词在文件中出现的频率;关键词出现的地方,如果它出现在标题中就比它出现在文章的第十行或者更靠后的地方更重要;还会考虑用户本身的情况,比如输入“纽约”,而用户位置又位于纽约,它就不会出现“纽”和“约”分开呈现的结果;另外,还要参考其他的网页对这份文件的重视程度,比如引用程度、频率,引用的量越高这个网页的排名就越靠前,这个网页的质量就越高或者越重要。

问:您所在的部门叫做“搜索质量评估”小组,能否具体介绍一下你们是如何工作的?

斯科特:Google每天要处理几十亿来自世界各地各种各样的搜索请求,这种情况下我们不可能关闭搜索引擎做一些修改之后再打开,就好比飞机已经飞上天不可能让它停下来更换引擎。我们使用精确的科学方法和流程对搜索进行改进。

工程师们每天会思考还有什么地方可以改进,并产生一些新的构思,比如新的衡量标准或指标。我们首先会对这些构思做必要性评估,然而在部门内部和数据中心的某一部分做一些小规模的对比试验。我们会针对一些搜索请求做两组结果对比。一种使用现有方法,做基本组,另外一组是对比组,使用新构思出来的搜索方法。我们会请一些独立的受过培训的评估员帮助我们进行评估,他们来自不同国家,说100多种语言,他们会判断基本组和对比组的搜索结果哪一个相关性和质量更高。然后通过统计学的模型对这些数据加以分析,并且做出统计学上的判断:它如果真正的应用会不会改变用户体验,是否会给用户带来更好的搜索结果。

之后将进入下一个阶段,就是在线实时试验。我们会随机选取一些用户进行试验,如果你是Google的用户,而且经常使用Google的搜索,可能在不知不觉中已经成为试验的一部分,你所得到的搜索结果也许就是用这种新的构思方法所得到的。在Google上,每时每刻都在进行着两百多项试验,所以你参与其中的几率其实很大。这些试验就相当于我们在网上聆听成千上百万用户的反馈,通过他们的行为来判断我们的搜索结果或者新的构思是否切实有效。2011年,我们做了五万多个这样的试验,最终做出五百多项改进。

在过去几个月中我们所做的一个重大调整就是在新鲜度算法上的调整,以给用户提供更新最及时的信息,这也为用户提供了更好的搜索体验。比如在日本海啸发生的前一天如果输入“海啸”这个字,可能得到的结果就是一般性的,比如什么是海啸、海啸发生的原因、全球海啸历史情况等。但在日本海啸发生之后的第一天搜索“海啸”,所得到的结果将全部都是日本海啸最新的信息和新闻。

问:当用户更注重实时内容时,Google评价搜索结果时会更看重哪些因素?
     斯科特:社交网络和个性化的搜索结果会越来越重要。像Google的Search Plus Your World(SPYW)这个功能现在实际上就在往那个方向走。个性化的信息可以呈现出和用户个人相关的信息,因为这对用户来说相关度最高。另外也更重视用户作为一个人和其他人之间的关系。另外可能还有一些新的指标和判断的因素。比如用户在使用手机搜索的话,就可以基于位置呈现搜索结果,因为未来会有更多的移动设备,因此我们还可以通过语音搜索,比如“我最近的匹萨店在哪?”像这种非常自然的语音搜索和查询也可以做到,这也是未来我们努力的一个方向。

问:在所有新的改进中,被动解决用户问题和员工主动提出创新的情况各占多大比例?
     斯科特:这两种其实没有办法分得很清楚,因为很多新的想法实际上就是在问题中发现和产生的。比如发现某一个问题,就想怎么解决这个问题,那就产生了一些新的构思和想法。我们自己用搜索引擎搜一个软件,结果出来的是这个软件的旧版本;我搜一个新闻,发现这已经是24小时之前的新闻,而不是最近的新闻,这就说明搜索引擎是有问题的。怎样解决这个问题,我们就会产生一些新的想法和构思,所以没有办法严格的说哪些是问题、哪些是创新。

已有0人参与

网友评论(所发表点评仅代表网友个人观点,不代表经济观察网观点)

用户名: 快速登录

经济观察网相关产品