《星球Google:我们的生活将怎样被一家公司彻底改变》

下载本书

添加书签

星球Google:我们的生活将怎样被一家公司彻底改变- 第14部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
在谷歌创办时,佩奇和布林还不必有###方面的担忧。他们一心一意地钻研如何让评定网页的过程自动化。他们的方法无疑优于雅虎依靠人工编辑来维持一个用人手挑选的网站指南引擎的运行。谷歌取代雅虎进而赢得领袖群伦地位的故事的启发###就在于,谷歌在计算机的应用方面比那些大公司更加灵巧。
  谷歌依靠搜索引擎起步,它只能从事检索和分析网页的单调工作。2000年,公司与当时比自己大得多的雅虎公司达成了一项交易——为雅虎的用户进行网页搜索。这对谷歌的财务而言算不上一宗大买卖,也无助于树立起自己的品牌。雅虎的用户甚至不知道谷歌才是提供搜索结果的“批发商”,而是以为这些结果都是雅虎找到的。但是这笔交易使谷歌得到了某种比销路和品牌意识更具战略价值的东西:它为谷歌提供了大量的搜索查询的第一手资料,这是谷歌改进搜索技术急需的原始材料,有了这项内在的能力,就可能将数据量的增长转变为搜索结果质量的提高。
  随着收集的信息越来越多,佩奇和布林的技术也变得越来越“聪明”,自然,俩人迟早会开始思考如何着手处理无所不包的原始数据。如何使用这些没有相互联系的具体信息,在当时还没有被当作最迫切的问题。先收集,后分析。如果这些信息还没有被数字化,那么谷歌就不计成本将其数字化。谷歌最早的网络经验体现在它比任何公司都更具有搜集更多信息的智慧上,它以多种方式让搜集信息的规模受人喜爱,产生交叉检索、相互参照的更加密集的集合,贡献出世界上复杂程度最高的搜索结果。
  谷歌比它的主要竞争对象雅虎和微软更早就认识到,一个将所有信息全部网罗殆尽的系统,依靠人工是根本无法完成的。正如人类的思维要依靠协调发展的神经系统内的连接一样,数字化的信息搜集也要依靠以软件带动的相互对接,而不必介入人工。软件的算法固然是由人制定的,但最终产品的复杂程度远远超过了人类凭借手工所能达到的水平。
  在公司建立的过程中,佩奇和布林运用了许多不同的算法。但在哲学定义上,这些不同的法则却不属于物质范畴:谷歌的所有算法都可以说属于总的算法的组成部分,所谓“算法”就是软件公式的简化形式,谷歌的创立者们以为它们是解决任何现存问题的最好手段。他们对算法的力量坚信不移,因而采取了一种颇引人争议的推论:由算法所导致的结果无需以人工介入的方式进行编辑、调整甚至触摸。对于处理世界上的所有信息的系统进行调节的唯一途径是将一切过程都自动化。算法也可以用手动的方式加以调整和改进,但是修补过程只能由算法在进行搜索之前自行完成。一旦他们允许对算法进行复评,并在搜索完成之后用搜索结果来修补,这种人工介入就会使系统变慢,使它步履蹒跚。在谷歌,实现规模至高无上,而这必须依靠完全自动化的过程。
  在谷歌成立之初,算法的力量在搜索业界并未得到广泛的赞赏。在雅虎-谷歌结盟时期,谷歌似乎不想对任何人摆出竞争姿态。在它的早年,即上世纪末和本世纪初,谷歌还没有找到明确的发展方向,也无法使人相信自己是一家能够将全世界的信息都组织起来的公司。倒是雅虎牢固地树立了作为值得信赖的信息来源的形象,似乎完全有可能将自己的任务完成好。作为门户网站,雅虎是许多网络用户在线访问的第一个地方,而且公司提供了一目了然的服务和信息。这使它成为用户必须访问的最可靠的网站。它提供的内容包括电子邮件、分类广告、游戏、新闻、体育、天气、股票行情以及管理员认为能吸引访客进来并使他们留下来的一切信息。

独步天下的谷歌算法(3)
如果它的用户感到有必要搜索网络,雅虎就能充当一个被公认为最权威的向导,因为它是由网站编辑亲手编纂的,他们仔仔细细地做着去芜存菁的工作,为网站整理清单,将内容分门别类层层分级。但是公司的管理层却不将他们稳定而高质量的网站目录系统视为值得珍视的战略财富。公司的观点与当时流行的看法完全相同,认为网站索引只不过是公共门户网站的一个次要组成部分,三分之二的雅虎访客都是为了其他目的或寻求其他服务而来。
  在雅虎,网络搜索可以分为两个互不相干的步骤,当然,其中隐藏着相当的复杂###。第一步,当搜索词语提交后,雅虎就对由它自己的编辑们编制的网站名录中的主题词表进行查找,如果搜索词与它索引表中的任一词语相匹配,那么相关的目录项就会显示出来。如果没有相匹配的结果出来,那么搜索就会进入第二个阶段,雅虎将这个词语送到与之订有契约的外部搜索引擎上,由后者在它所搜集和整理的所有网站上的网页的拷贝页中进行查找。这第二步几乎被业界的每一个人都视为无趣的幕后服务,这种服务从任何可互换的提供者那里都可以得到,他们之间并无明显的差异。一个个看上去都十分相似,所以雅虎也定期更换为它提供幕后服务的公司。
  2000年,雅虎决定将分作两步的搜索过程合并,并将此项业务交给新的一揽子服务提供商——谷歌。在当时还很弱小的谷歌看来,能以成立刚刚两年的资格就得到雅虎交付的如此重大的使命,无疑很有成就感。谷歌搜索的质量相当之高,它已经在强手如云的领域里脱颖而出。根据2000年对于用户体验的一项研究,在13个搜索网站中,谷歌名列第一。此外,谷歌之所以能得到雅虎的合同,不是因为它的搜索结果比此前的Inktomi公司好,而是因为当时的谷歌正愁无米下锅,所以它开给雅虎的提供同样服务的价格是最低的。在Inktomi丢掉了雅虎的合同后,它的一名负责人嗤之以鼻道:“我们不会为了赢得生意而不计代价。”
  雅虎之所以未把谷歌作为潜在的竞争对手,原因就在于谷歌不同于Inktomi,它披着一件“零售商”的外衣——它自己的网站,它可以向顾客提供更好的搜索结果,从而为自己吸引越来越多的访问者。在谷歌与雅虎签订提供搜索结果的合同两年以后,谷歌在美国搜索业务市场的份额就达到了雅虎的水平。与此同时,谷歌在全球范围内也跃居前列,到2002年4月,谷歌就承担起全世界范围内47%的搜索量,而雅虎的比例是21%。尽管如此,直到又两年之后的2004年,雅虎才意识到,它与谷歌的合作是个巨大的错误。于是,雅虎立即在自己的网站用自己的搜索引擎换下了谷歌的引擎。雅虎试图使人相信,它仍然控制着一个功能,它终于懂得,这个功能对它继续保持成功者的位置至关重要。然而此时,谷歌作为搜索中心的地位已经得到了巩固。
  雅虎甚至从未近距离地追上谷歌。根据一项研究,2007年5月,谷歌在美国在线搜索所占的份额已经超过了50%,雅虎占26%,而微软只占10%。谷歌的份额持续扩大,到2008年1月,谷歌占有了58%,而雅虎则掉至22%。新闻网站的CEO里奇·斯克伦塔说出了一个相当具有说服力的事实:谷歌所占有的搜索份额远远高于上述市场分析的结论,甚至早在2006年底就已经超过了70%。2007年初,斯克伦塔承认,他的数据表明,谷歌的市场份额实际上是78%~80%,但他用四舍五入的方法把这个比例降到比较保守的70%,“以使之更加可信”。 电子书 分享网站

独步天下的谷歌算法(4)
2008年,当微软洽购雅虎时,公司的雇员们都发表了意见,认为两家的工程师能合并为一支队伍,将更有利于与谷歌展开竞争。但是谷歌的算法之所以在它还是一家小公司的时候就能得到较好的搜索结果,关键在于谷歌工程师队伍的质量,而不在于它的人员数量。
  无论是微软还是雅虎,两家公司对于谷歌算法的威力的认识都过于迟缓。在谷歌浮现的早年,雅虎就受到依赖人工编程这个注定要倒霉的决定的拖累。1998年,在40人的雅虎索引维护团队中负责的斯里尼瓦桑(Srinija Srinivasan)说,她和她的新编辑们总是赶不上网站的增长速度,尽管他们已经开始对“无限的资源”进行了自行处理。从这个较早的时候开始,他们就已经不再勉为其难了——而是决定简单地满足于将自己选出的东西描述为“已有的东西当中最好的”。当然,凭什么他们肯定自己能从急剧膨胀的数据池里鉴别出最好的东西,这是一个难以回答的问题。
  而就在此时,谷歌已经享受到了依靠不断更新的技术所带来的好处。算法塞进的数据越多,结果就越好。公司并不隐瞒算法所处理的网页到底有多少——2004年,他所公布的最后数字是对80亿个页面做了索引,此后它就决定不再提供更新数字了。但即使在2000年,观察家们就已经极力称赞谷歌的搜索结果与其他的引擎相比具有显著的优势。丹尼·苏里文在《搜索引擎报告》中写道:
  当我对一群人说起搜索引擎并提到谷歌时,听众中有些人便会有不正常的反应。他们微笑、点头,就跟你在发现了一个别人不知道的秘密通道时也会有的那种表情一样。每次我说起这些事,都会看到有越来越多的人像这样微笑、点头,为发现了谷歌而惊喜。
  谷歌研发了一种更加复杂的算法,它可以根据一个给定的搜索词语来选择哪类广告在它的搜索结果上出现,从此,它与竞争对手的距离就更加拉大了。谷歌采用拍卖机制,让赞助商竞标,从而确定他们愿意为每一个点击支付的最高金额。这种方式是谷歌的任何竞争者都可以仿效的。但谷歌还有一个令人意想不到的手段,保持它网站上的广告带来的利润远远超过其他任何网站发布的广告,即采用算法对赞助商在历史上的表现进行评估,看看他的广告对点击率的吸引力

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架