腾讯科技讯(王芮) 北京时间3月15日消息,国外知名科技媒体AllThingsD撰文称,谷歌(微博)正在努力研发更为智能的搜索方式,Google Instant和Google Now就是其努力成果的表现。但为了得到搜索结果,人们往往会使用僵硬、破碎的语言,谷歌正在努力研发出更为自然、对话式的搜索方式。这将是今后搜索业的发展方向,但想要真正实现人机自然互动仍有很长一段路要走。
以下为文章全文:
很长时间以来谷歌搜索业务主管阿米特-辛格尔(Amit Singhal)都很喜欢用一个例子来描述他和别人口中的“对话式搜索”。他拿起他的手机说,“贾斯汀·比伯(Justin Bieber)年龄是多少?”然后紧接着他又会问一个问题:“那他有多高呢?”
辛格尔在近期的一次采访中说道谷歌对于代词和首语重复法的使用已经有了一个基本的解决方案。所以当他问完这两个问题之后,Android女机器人在回答的时候能够理解第二个问题中的“他”就指的是第一个问题中的人。
“在过去,搜索一直都是一次性的事情。但现在谷歌的搜索技术已经能够让机器人意识到‘他’指的就是‘贾斯汀-比伯’,还没有人能够做到这一点。”辛格尔表示。
“今天,我向你们显示的是两个句子的对话,”辛格尔说。“在今后的一两年内,我们还会看到在搜索中有更多句子对话的产生,对此我一点都不会感到惊奇”,即就是说在未来用户能够像和人交谈那样和机器对话。
不仅是界面问题
一直以来,网上搜索都在训练我们去使用老套僵硬的语言。键入所需的相关信息,分隔开关键词,每一次搜索都要从头开始,使用引号以强调出一个搜索内容。搜索的语言足以成为一种外语,有些人还称之为“搜索语”。
近期,谷歌和其他公司展开合作的内容之一就是搜索业务,他们正在努力使搜索变得更为自然,以对话的形式实现人机互动。
对话式的搜索就是让搜索引擎能够理解问题的背景,做出合理的猜测、能够接受语音输入、能够解析同音异义词、能够适应移动环境、能够在不同的设备中识别出同一个用户。
早在上个世纪90年代就已经提出了类似的想法,AT&T实验室Watson项目以及麻省理工学院Jupiter项目中一部分就是实现对话式搜索。Jupiter就是一款手机服务能够理解用户有关于天气的询问并作出回答。
尽管从表面上看,研发对话式的搜索业务似乎是一个界面问题,发明出一种让人们获取相同潜在信息的简单方法就可以了,但实际上,这种搜索方式要使用到深入的人工智能技术,以及非计算机行业的技术。另外,这种搜索技术也要比其他新生搜索形式,如谷歌的“Knowledge Graph”涉及的范围更广。
回到辛格尔举得那个例子上来,微软搜索引擎Bing的主管斯蒂芬·韦茨(Stefan Weitz)表示微软目前确实还不能处理多重搜索,但涉及Xbox的结构式搜索却可以做到这点。
Bing也在许多领域努力使搜索变得更为自然并实现人机对话,例如,微软一直在意义明确的搜索上努力使其更为自然、在语义学上进行研究并推出了个人化应用,如Local Scout。
“当人们在讨论对话式搜索时,他们所真正讨论的是那种理解你所说的最后一句话或是你最后所去方向的机器,”韦茨说。“真正的挑战是如何能够用利网页,这种高清的实体代理去重新解构数字世界。”
所以,Bing现在就能回答一些诸如“汤姆克鲁斯出演过并带有独角兽的电影”或是“世界上最高的山”的问题,虽然Bing还需要一段推断过程。
未学习到的尴尬
谷歌所发布的第一款对话式搜索软件应该是Google Suggest, 这款搜索引擎从2004年起研发,如今只完成了“20%”。当用户在键入搜索内容时,这款软件会自动出现完整的搜索内容。Google Suggest是Google Instant的前身,Google Instant在2010年推出,能够为用户搜索的问题提供可能的答案。
约翰-伯伊德(John Boyd)是谷歌的一位研发主管,其所管理的团队负责邀请用户以观察他们对谷歌新产品的体验,并设计调查以评估用户在未来所需的产品体验。
谷歌研发主管约翰-伯伊德(腾讯科技配图)
伯伊德在那些装有一面镜子,并包含一个安装眼球跟踪仪电脑的房间中接受了我们的采访,他表示目前他的工作中有一个颇为奇怪的现象,那些邀请来校园里配合他们研究和调查的志愿者们往往都没有注意到谷歌是在测试何种软件。当他的团队对用户使用Google Instant的体验进行测试时,一些志愿者猜测此次测试的新技术是左边陈旧的导航栏,而不是就出现在他们眼前的搜索结果。
由于没有之前和之后的对比,即使是在你每天使用的网站上,人们也很难辩认出哪些是新技术。
但这也并不是一件坏事。伯伊德最想在谷歌搜索上做出的改变是能够将人们从不知不觉形成的习惯中转移到自然的对话式搜索中去。
“谷歌是有魔法的,”伯伊德说。在加入谷歌之前,伯伊德曾担任雅虎搜索部门的主管。“但是由于我们之前一直没有进行干预,人们如今已经形成了这种坏的习惯。”
他的话所谓何意?举例说明,一些人认为当键入的问题全部大写时,搜索引擎会表现的更加出色。但事实上却不是这样。
伯伊德说这其实就是行为主义心理学家史今纳(B.F. Skinner)所提出的的“盲目性学习(superstitious learning)”。例如,一些搜索者会趋于使用双引号以试图告诉谷歌他们真正想找的内容。但这样做有什么坏处呢?引号往往是不需要的,它们在搜索中是多余的,有一些情况下,它们还会排除我们所需的结果。伯伊德演示了这种做法,从他表现出的烦躁情绪就可以看出这样做确实效率低下。
伯伊德说从更广泛的角度出发,谷歌应该对于我们想要知道的内容有更好的反应。这样我们的搜索就不用每一次都从零开始。
你想问什么?
为了解决这一问题,去年谷歌曾组织了一次对150人做出的调查研究,在一天的时间里让这些参与者不定时地使用一款订制的移动应用进行搜索,谷歌就可以发现他们想知道什么。
伯伊德向我显示了一位女性参与者的记录文件,她询问的问题主要有“如何才能让我在8天的时间里获得200美元?”、“一个人需要多久才能被起诉?”、“什么是弦理论?”、“乌贼长什么样?”、“如何做才能让我们的女儿远离我一会儿?”、“怎么做我的牙齿才能不疼?”、“如何才能找到保释代理人?”
与此同时,另外一位男性参与者则表示他的汽车有些问题、小狗可能长跳蚤了,需要一点钱,一个烟雾警报器需要重新安装,以及想为他的孙女买一辆小车。
这些问题不论大还是小,都能帮助谷歌更好的理解这些问题从而能够更好的帮助用户。
例如,这位女士问的一系列问题都围绕着“监狱”这个主题,谷歌在这方面可能帮助不了她。但这位男士的问题则跟日常琐事有关,或许谷歌在这方面能够帮助他使他的生活更为有序。
目前谷歌在搜索业务努力的主要有两个方面:语音搜索,这个在用户驾驶或是双手被占的时候尤为有用,和在Android平台上的智能个人助理Google Now。
个人助理应用Google Now(腾讯科技配图)
与此同时,在Android平台上的Google Now应用还能够帮助用户记录他们的生活习惯,根据用户搜索的历史向用户显示一些信息,如运动场位置、天气和道路情况。近期此项应用又增添了新的功能,当用户在指定的时间进入一家电影院或是飞机场时,Google Now能够向用户显示之前所购买的的电影票以及登机牌。
“我们的用户需要帮助的情况都大不相同,”Google Now产品主管巴利斯-哥特肯(Baris Gultekin)近期在一次访问中表示。“我的目标是能够预测出用户所有的需求,并且在你有所需求的时候能够做出正确的预测。这是一项庞大的工程。目前我们正在努力能够给予用户所需的信息,在用户询问之前就能够提供所需信息。”
对于那些并不顾忌隐私泄露的用户而言,这是一次重要并令人激动的技术前进。但要想实现和电脑的随意交谈恐怕还会有一段很长的路要走。Google Now理解的只是我们人类世界里的凤毛菱角,而每次的技术前进都离不开幕后人员的努力以及和美国电影票务提供商Fandango以及和美国联合航空公司等类似公司的合作。
尽管语音识别已经比以往前进了一大步,但用户还会发现自己难免会陷入到“搜索语”当中,用户往往会很小心的发每一个音并便于让机器识别。我们离真正自然的人机互动还相差很远。