• 图片新闻
  • 天图简讯
  • 业界动态
  • 公告栏
  • 媒体报道
  • 活动预告
  • 在线视频

您当前所在的位置是:首页>>新闻资讯>>业界动态

网络搜索的未来趋向
发布时间:2009-09-26

       作为谷歌(Google)的研究部主任,诺维格(Peter Norvig)总是站在管理世界信息的最前沿。他完全胜任这一工作,并经常把许多时光都用来思考计算机的智能,以及如何更为有效地把它实现。诺维格作为一个计算机人工智能专家,曾在大学里讲过学,在美国企业界和美国国家航空航天局从事过研究工作,还与他人合作撰写了颇具影响力的教科书《人工智能:一种现代方法》(AI: A ModernApproach)。

  诺维格于2001年加入谷歌,并担任搜索质量部门的主任;4年后,他担任了现职。在这一职业生涯中,他对约100位计算机科学家的项目进行了研究和开发。这些项目真可谓是五花八门。比如,医疗记录管理和机器翻译等。正是谷歌服务器中所容纳的这无数个搜索网站,为这些科学家们提供了一个试验的平台。诺维格认为,谷歌的体制就是要如何保证这些研究人员不离开本公司。他说:“他们对公司的忠诚主要体现在他们正在开发的产品项目上。”当诺维格来到芒廷维尤时,网络搜索只是提供一些与某个问题相关的网页。但随着网络的发展,人们对快速浏览信息的需求也随之加大。最近,就网络搜索行业的未来发展,诺维格接受了《科技商机》信息技术编辑格雷尼(Kate Greene)的采访。

  谷歌有许多创新产品,但10年来,搜索网站并没有发生本质上的变化。这是为什么?

  诺维格:我们偶然发现了人们通常都会喜欢的东西,但我们并不是最先做这事情的人。回到Excite网站和其以前的一些搜索引擎,你会看到一个信息框,那里就列出了10个结果,每个结果都附了一些简单的信息,我们只是继续跟随这个方法。

  有什么改变吗?

  诺维格:规模上的改变。谷歌包含的信息也许是过去的1000倍以上。过去,它只是网页,而现在,它包含了视频、图片、博客以及各种新闻媒介。另外,网络的直观性也有所改变。起初,我们每个月将索引升级一次。当时,我们只是把它看成是一个图书馆的图书目录,一个可以长期使用的东西;而如今,我们则认为它是最新的媒体。当人们搜索最新新闻时,总是希望在几分钟内就能读到,而不是几天、几周,甚至是几个月后。

  你认为,谷歌网络搜索的准确性是相当高的。你是怎么知道的?你将怎样才能做得更好?

  诺维格:我们采用了许多方法进行测试。大致说来,我们一直在追踪用户的点击记录。如果他们只点击了排列在第一位的搜寻结果便已完成搜寻,这表明他们得其所愿;如果他们一页一页不停地翻找,并重组问题词,我们就会知道,其结果并不是他们想要的。同时我们还采用了另一种方法,比如随意选择一些特定的问题词,而后请人对我们的结果进行评价。他们是我们聘请的顾问,我们教他们如何识别垃圾邮件和一些次等的网址,然后再把他们的评价记录下来,并进行追踪调研,以使这些评价成为一种黄金标准。当然,人是最重要的因素,我们希望能够做得更多。此外,我们还邀请一些用户参观我们的实验室,而我们的技术人员也去进行家访,观察用户的搜索过程。所有这些都能让我们更深入地了解用户遇到的问题。

  美国ASK和Powerset等公司都坚信,未来将采用“自然语言”的搜索,即让用户使用真正有用的句子而不是比较模糊的关键词。那么,就“自然语言”而言,谷歌都做了些什么?

  诺维格:我们认为,“自然语言”重要的是如何把词汇联系到用户正在寻找的概念上。但在我们看来,输入一个问题而不是关键词并不是一个大的进步。比如,输入“法国的首都是什么”,其结果肯定不如输入“法国的首都”好。理解词汇如何组合在一起,这才是重要的。比如,“New York”(纽约)不等同于“York”,但“Vegas”就是“Las Vegas”(拉斯维加斯);“Jersey”可能是“New Jersey”(新泽西),但也可能不是。这些才是我们正在关注的“自然语言”。我们寻求的是词和短语,而不是句子。我们认为,重要的是要得到正确的结果,而不是要改变它的界面。

  针对个体用户,谷歌搜索的个性化特点到底有多少?

  诺维格:我们正在不同程度地做着这样的工作。比如说新闻的个性化,由于新闻的数量有限,我们可以向用户推荐新闻报道。与一些大的网络数据库相比,我们所做的这些可能要容易一些。我们会追踪你留意哪些新闻,并把它与其他用户进行比较,这样做很见成效。把个性化应用到整个网络是比较困难的,但我们可以从简单的地方开始做起。

  你怎样看待未来两年到5年内谷歌搜索的发展前景?

  诺维格:不久的将来,你会看到各种不同的集成内容。我们正在开发语音识别技术,以及手机上的各种界面,以配合手机较小的屏幕和使用不便的键盘。这将成为今后谷歌搜索的发展主流,同时,你也会看到谷歌搜索研究和开发的各种特性。过去,我们常常问用户需要的是网络搜索、图像搜索还是视频搜索;而如今,这些问题已经不是问题,因为我们向用户提供的是有意义的结果。