访Google搜索副总裁 今天的搜索有多成熟
6月6日国际报道 搜索已成为互联网运转的核心,也是Google业务的重中之重。
Udi Manber是Google搜索部门副总裁,主要负责搜索业务算法研究。他的工作高度机密,因为Google不想让人了解其中的玄机。不过Google近来开始少量向外界公布自己的核心搜索业务的情况。Udi在Google总部接受了我们的专访。 今天互联网搜索有多成熟? Udi:做个类比,一个15岁的年轻人认为他很成熟。一个19岁的人认为他异常成熟。不过,每过几年你都会意识到以前都不太成熟。网络搜索就好像15岁的人,不过很明显,我们现在比5年,10年,15年前成熟多了。 你毕业于亚利桑那大学,然后在雅虎,亚马逊网站,A9工作过,2006年,你来到Google。你从这些不同的经历学到了不同的东西吗?或者只是公司名片的电话号码改改而已? Udi:现在的公司规模更大一些,也更好。现在的团队比我以前共事过的要大。我们投入更多的资源在团队上。 在网络发展的早期,我还记得AltaVista,HotBot和WebCrawler这些搜索引擎的存在。 Udi:我也记得它们。当时这些搜索引擎看上去非常精美和成熟,现在回首又是另外的感受了。 搜索引擎变得更有用了。不过10年之前,人们并未想到我们将会通过一个搜索框来获取信息,现在,这种方式显得理所当然了。10年之后又会怎样呢? Udi:10年前,还是有一些人知道这一点。不是吹牛,我当时就很清楚这一点。这就是我为什么在90年代转行搜索行业的原因,因为每个人都在谈论信息革命。很明显有一场信息革命,信息的存储,传输等,你需要找到它们。 在巨量信息中找到想要的东西成为这场革命的关键。虽然现在这一点已经很明显了,不过在6到7年前,这一点还不是很清晰。我们认为Google之所以现在这样的成功,原因是创始人 Larry Page和Sergey Brin 10年前就看清了这一点,然后投身其中。 90年代初,只有很少的人从事搜索研究,领域也很有限,象司法搜索,医学搜索,药物搜索等,当时,如果你要找一个信息,你得让专业人士来完成,你告诉他自己要找的东西,他来给你执行搜索。我们认为,人们应该自己来完成搜索,不必找专业人员,这就是一场革命。 我预计,未来人们希望搜索到更多的东西,因为现在有很多东西在Google上还搜索不到。 10年前,如果你能够找到问题的答案就很满足了,现在,如果你在第一或第二个搜索结果中找不到答案的话就会不满意。这种转变很好,人们的期望就是我们将从事的事情。 搜索技术的一个有趣趋势是个人化。比如我喜欢照相机,如果我进行一年的搜索工作,Google就会明白我喜欢照相机。个人化技术有多成熟? Udi:是的。如果你允许,我们将保存你的搜索历史,并且用它来改进你随后的搜索。个人化技术不是要彻底改变你的搜索结果,它只是略微的调整你搜索的结果。即使你很喜欢照相机,你的搜索页面上仍然有大量与照相机无关的东西,如果参照搜索历史,那么结果就会好很多。 现在人人都加入了社交网络,那么整个互联网搜索与个人搜索之间有交叉层吗? Udi:我们能够用个人信息来改进你的搜索。比如,你搜索了1百次照相机,这就会告诉我们很多信息。如果你的朋友执行特定的搜索,它们也是一种信号。 Google搜索结果的确定性怎么样?比如,在不同的时候执行相同的一个搜索,结果会一样吗?因为你们有这么多的服务器,搜索结果会在这些系统之间缓慢的发生变化吗?如果我明天在波士顿进行一个搜索,或者在没有开启同步功能的情况下搜索,结果会不会不同? Udi:搜索结果是通过系统来进行过滤的。系统以很快的速度来完成搜索工作。如果你在不同的服务器集群上进行相同的搜索,那么在一定的时间,其结果可能有轻微的不同。同样,如果你在不同的时间执行相同的搜索,结果有可能有所差别,因为有些结果可能我们刚好在5分钟之前进行了收录。 我们收录信息的速度确实很快,如果世界上有事情发生,你可以在1个小时内搜索到与这一时间相关的众多页面。时效性对我们来说非常重要。 另一个因素取决于位置。如果你在不同的国家进行相同的搜索,甚至你用一样的语言进行搜索,你得到的结果会不一样。我们会根据国家的不同改变搜索结果。 通用搜索的情况如何?人们在多大程度上会用到它? Udi:我们希望你来Google.com搜索到你想要的任何东西,我们会想法判断出你要的是一段视频,一本书,或者当地的信息。根据你的搜索,我们将在搜索结果页面上插入不同的媒体类型,象图片,你不需要再去Google的图片页面找图了。 你们如何将色情信息从搜索结果页面上清除?现在人们不想要两类信息,一是垃圾信息,二是色情内容。 Udi:我们在这方面投入了大量的精力。我们专门有一个团队在从事色情信息的清除工作,这种清除范围不仅是在美国,而是在全球范围。我认为我们的工作很出色。不可能百分之百的清除,但它们的数量已经很少了。我们对这一点相当重视。 和垃圾信息一样,这是否有些像猫和老鼠的游戏? Udi:不尽然。我觉得,大部分色情网站并不想欺骗你,而垃圾信息网站的目的是要欺骗你,色情网站已经有自己的客户群,他们不需要去欺骗。色情网站的身份很好确认。 我对命令行界面搜索的回归很好奇,和常规的搜索相比,命令行搜索的不同点在哪里?人们需要专门学习命令行搜索方式么? Udi:我们不想强迫人们去学习专门的语法与命令。我们希望在用户不需要学习的情况下理解他们的想法。不过这也不排斥用命令行搜索。我们只是给专业人士提供一个专业搜索方式。 目前,行业垂直搜索已经发展壮大,比如化学,医疗,健康,司法搜索。你们会进入这一领域吗? Udi:我们的发展方向是通用搜索。我们希望在Google搜索中融入全部的东西。我们的结果界面中已经包括了专业搜索的东西。 在视频和相片方面,计算机会不会有朝一日会判断出内容,而无需人们使用文字标签? Udi:我认为我们能够在这方面做得更好。图片本身不会告诉我们它表达的是什么,因此,图片的元数据将变得越来越重要。 用户创建内容的模式会让你们在这方面更进一步吗?比如,挖掘Flickr和Picasa网络相册中的信息。 Udi:肯定会有所帮助。 对于很多搜索来说,我们得到了维基百科全书的内容。你认为这是好事还是坏事?维基百科当中已经包括了大量的连接到自身的链接,是不是这个原因提高了它的搜索排名? |