百度下一个十年根本所系,在于一套更智能化的产品架构 文 《环球企业家》罗燕 在1月16日的百度十xxx典上,即便谈及几天前的域名被黑事件,也不能影响创始人李彦宏的情绪。与所有类似场合一样,李在北大东门附近的一个体育馆里,对坐满全场的8000名员工回忆起2000年7人创业时的情景。这个平素偏内敛的人在高调宣布了百度下一个10年的愿景—营收增40倍,成为全球{zd0}媒体平台,在全球一半以上的国家成为家喻户晓的品牌—后,身着红衬衫与舞伴跳了一场火爆的拉丁。 庆典过程中,李彦宏还对研发团队、创新业务团队进行了逐一的“点名”,这让人回想起2002年的一幕。当时为在搜索结果上尽快赶超谷歌,百度进行了至关重要的“闪电计划”,为鼓舞心中无底的下属,李彦宏在会议上中对不到10人的小团队进行点名式询问:“郭眈有没有信心?”“崔珊珊有没有信心?”? 现在,已经是百度高级技术总监的郭眈和崔珊珊接替了不久前离职的CTO李一男,主管负责百度技术方面的相关业务,而他们与之一同成长起来的百度已是全球{zd0}的中文搜索引擎。但挑战依然存在。要知道,用户从一个搜索引擎切换到另一个搜索引擎所需要的成本几乎为零,如何更好地满足用户的基本需求,如何精准地满足用户更复杂、更古怪的需求,如何提前考虑到并且满足用户尚未明确提出的潜在需求?一言以蔽之,如何让小小的搜索框承载更大的使命。 这是百度和它的技术、产品团队始终在思考的问题,也是所有搜索引擎都在极力解答的问题。 —2009年8月,在微软与雅虎签署搜索合作协议两个星期后,谷歌宣布开始公开测试代号为“xxx”(Caffeine)的新一代搜索引擎。谷歌资深软件工程师迈特·卡茨(Matt Cutts)表示,“xxx”并不是用户界面的升级,即使资深用户也不会感到搜索结果页面有太大变化。这次升级的实质是后台技术更新,这意味着谷歌正在重写其搜索结构基础。目前谷歌已将“xxx”部署到一个数据中心,如果用户的搜索结果来自那个数据中心,他们会发现搜索结果里除了文字连接,还包括图片、视频等多媒体信息。除了“xxx”,最近谷歌还在搜索结果中加入了来自Twitter,、Facebook和MySpace等网站的实时信息,使得搜索结果变得更新鲜。 —2009年下半年,微软与“计算型知识引擎”Wolfram Alpha搜索展开合作,希望将自己的搜索引擎Bing研发成一款决策型引擎而不仅是搜索引擎,能直接为用户提供更准确的答案。最近,其在Bing的搜索结果中显示更多信息,希望用户无需点击搜索结果链接即能获得想要的答案—深入的天气报告、产品细节、甚至医院的评估等,当用户通过Bing搜索旅游相关内容时,可能得到旅行目的地选择建议、目的地城市的事件和游览胜地。这些信息通常来自多个资源,包括与微软签署合作协议的一些公司。 搜索引擎正在变得越来越智能化、个性化和多元化时,百度也在努力随之进化。 让搜索无所不能 李彦宏对搜索革命的思考可用3个字简单概括:框计算。 在2009年百度技术创新大会上,李正式提出这个技术理念,其核心在于让搜索框成为满足用户各种信息及应用需求的入口,即用户能通过一个简单的“框”,找到任何内容、实现任何应用。尽管业界对未来的互联网应用是不是都会被纳入这个“搜索框”中存有质疑,但搜索的未来却无可争议:无论使用的终端是PC、手机还是游戏机,无论输入方式是键盘还是语音,用户都应该能通过搜索引擎轻松找到任何自己想要内容,甚至直接实现某个行动。 这意味着传统搜索引擎至少要在两个层面进行变革和深化。 过去,搜索引擎提供的搜索结果大多为文字链接,技术部门要所解决的最核心问题是:切词是不是够准,抓取的文字链接是不是够全、够新,匹配是不是够相关。但未来的搜索引擎不仅要提供文字链接,还必须将图片和视频等多媒体形式的内容纳入索引中,同时对用户行为和心理进行更精准的定义和分析,如是才能让不同用户搜索同一个内容时,得到与自己最相关的多种搜索结果。 “传统的搜索都是基于文本切词、索引、字面匹配的,现在要满足用户需求,资源本身可能不仅仅是文本,例如可能是Flash、图片、视频、应用程序,而匹配过程也不仅仅是字面上的,需要的是对潜在语义的理解。。搜索引擎怎么对这些资源进行索引?又把它们排到什么位置?我们的架构和策略都要据此做很多调整。”现负责中日文网页搜索团队和网页搜索产品市场部的百度高级总监王梦秋对《环球企业家》表示。这是“闪电计划”之后,百度在技术方向上做出的{zd0}调整。“我们原来的口号是‘百度一下,你就知道’,以后可能就是你到百度来不仅是‘知道’,还可以‘知而后行’。” 一个插曲是,在百度刚出任CTO一年多的李一男在2010年伊始离开,这让外界担心百度技术走向是否因此发生改变。但据百度内部人士称,框计算的{sg}项目“阿拉丁计划”在李加盟之前就已立项,他的离职不会产生大影响。 事实上,阿拉丁计划的雏形之所以在2008年第二季度被提出,就是因为百度技术和产品部门发现当大众熟知搜索引擎后,需求正在发生很大改变。人们不仅需要搜索文字网页以外的视频和歌曲等多媒体内容,关键词也变得日益复杂,并且希望能通过搜索做出决策,而不是得到链接。比如,有人会在百度上搜“身体瘦弱,性格内向,一男孩应该报考什么高职专业”,在获得搜索结果后,还可能会有一系列其它动作。 如今,百度这样的搜索引擎已经越来越等同于整个互联网的入口,但仅充当告诉用户信息是什么、在哪里能发现信息的“指路人”显然不能让百度和用户满足。对那个想知道身体瘦弱、性格内向适合什么专业的男生,现在百度只能把他引导到某个相关资讯网站或报考志愿的指导网站上去,但百度的技术和产品部门希望,未来的搜索引擎能直接为他提供一个在线专家,甚至更为直接的解决方案。百度近日悄然上线的歌曲试听就是类似方向的新尝试,现在用户可以在搜索结果的{dy}条就看到百度与之有合作协议的正版音乐,不用再进入其它页面。 另一个需要百度完善的技术方向是实时搜索。随着即时通讯工具、微型博客和贴吧等更小更快的信息传播渠道的增加,互联网信息不仅在以几何级数增加,而且变得更动态。以前,很多人是在事件发生一段时间后才从某种渠道得知,然后上搜索引擎寻找更详细信息,但现在突发事件能在几分钟内传遍互联网,这就要求搜索引擎反应更灵敏。 面对差异性极大的用户需求,一个简单的解决方案是在搜索引擎中建立更多细分频道,比如音乐和视频等。越聚焦,准确性自然越高,但这与产品的用户体验背道而驰—细分频道越多,用户使用起来就复杂。百度的研发团队认为,与其让用户记住很多频道并进行多次点击,不如让他们直接到baidu.com这个{wy}的入口,然后由百度来判断用户需求并提供解决方案。 难题随之而来。每个人对信息的需求都不相同,信息本身的属性也大不一样,以突发事件为例,这种实时信息有的是全国性的,有的则是地域性的。这种区别至少给百度带来两方面的挑战。其一是对个体用户需求的精准判断,如何让每个人眼前同样的搜索框,展现出各不相同的内容;其二是信息采集,必须深入了解实时信息的产生规律,才能通过自动的系统去高效率的采集实时信息。 让搜索无处不在 致力于打造新一代搜索引擎的阿拉丁计划是百度解决这一系列问题的希望所在。 据王梦秋向本刊介绍,阿拉丁计划会率先解决百度在框计算中遇到的一些难点,比如需求识别,需求和资源间的匹配,嵌入信息或嵌入某种应用的{zj0}呈现方式。这些背后,是语义分析、自然语言处理、用户行为分析和心理分析等各种关键技术问题。 最初立项阿拉丁计划时,百度只希望通过分析用户需求,把图片、视频和地图等信息整合进搜索结果,同时在结果页面直接提供“珠峰高度”这样一类问题的确切答案。 进行过程中,百度发现很多信息难以被搜索引擎调用。百度知道和贴吧这样的产品已将很多原来只存在于人脑中的信息转移到互联网上,但有大量信息并不能被搜索引擎采集到,这就是所谓的“暗网”。比如,招聘信息这种结构化的、实时更新的数据,以传统搜索的抓取方式,比较难以被快、准、全、新的索引到,但它们确实存在于互联网上。 因此,当百度正式启动了“阿拉丁计划”时,不仅将图片等垂直搜索结果整合进入baidu.com,也将百度的平台向第三方网站开放,为“暗网”信息web化提供便利条件。同时,百度也在对技术架构进行调整,让第三方提交的有效信息在通过百度审核后,能最富有效率地被百度索引。目前,在百度搜索人民币汇率、股票、天气预报、万年历等信息时,用户都可以体会到“阿拉丁”的效果。 除了内容上的深入挖掘,百度还希望自己的搜索服务能覆盖任何领域,尤其是蓬勃发展的无线行业。 2009年,随着3G牌照的发放,在无线业务方面一直态度谨慎的百度终于决定发力。到2009年底,原属新产品部门的无线搜索团队被单独剥离出来,组建成无线搜索部,并成立无线战略小组统筹管理公司无线业务,由百度创业元老之一的王啸领军。李彦宏、百度市场与商务拓展副总裁任旭阳、高级副总裁沈皓瑜、高级技术总监郭眈和离开的李一男等人,皆是这个小组的团队成员。不久后,无线搜索业务和无线客户端软件业务合并,成立手机搜索业务部。 在改进无线搜索服务之外,百度在2009年还推出手机输入法和移动客户端产品“掌上百度”。前者用于满足手机用户基本的输入需求,后者则在无线搜索业务的基础上整合了贴吧、知道等搜索社区服务,以便让用户能更便捷地使用手机终端进行搜索。 看上去,定位服务也将成为百度无线战略的重点之一。王啸对本刊表示,3G标准中具备位置定位能力,这意味着随着3G手机上网的普及,位置相关的服务会成为比较有价值的应用。过去,百度并未对其地图产品动用太多资源,但在2009年,百度开始在该领域发力,与地图资源厂商进行合作,开发了一套地图引擎。这无疑将为其无线业务发展提供支持。 虽然百度不愿透露正在确定中的未来发展详细规划和实施步骤,可以肯定的是,其已和中国联通、中国电信等运营商以及诺基亚、三星、联想、联发科等多家手机或芯片厂商进行无线搜索、掌上百度和输入法等产品的预装合作,未来还将在合作层面进行更大投入。2010年或许就是百度种种布局初见成效的一年。 不能忽视的变化还包括,2009年9月,百度在日本的无线搜索也已经上线,在无线业务蓬勃发展且竞争激烈的日本市场,百度的尝试势必能积累下诸多经验和教训,这些都能为国内的无线业务布局提供借鉴。 |