司策略的实施无关。虽然来自地方上的批评家为阻止谷歌数据中心的建设发表了损害###的意见,而且这些意见还相当有道理,但是仍然很快就结束了。
分布在各个站点的数据中心构成了信息化时代的经济所依赖的非常重要的后工业化的基础设施,就像蒸汽机和铁轨是19世纪铁路时代的不可或缺的基础一样。谷歌比它的竞争对手们更早懂得了集中化的计算能力将有何等的重要,原因就在于它的创始人也比竞争对手们更早地意识到互联网所涉及的领域具有前所未有的复杂###。在谷歌公司刚刚成立时,Web还只是一个在线参考咨询台,但随着时间的推移,整个的互联网——包括用户们看得见和看不见的各个项目——事实上已经变成了一个与现实世界同时存在的完整的世界。由于在线生活的人越来越多,它正在日益变得广袤无边。为了对一切可能的对象加以整理,用户对搜索引擎的依赖只会增加。谷歌将维护自己作为一个不可须臾离开的指路者的形象。
2004年4月,埃里克·施密特说谷歌的压倒一切的目标就是“努力使谷歌成为人们在线生活的地方”。为了加快实现这一目标,谷歌必须在实体世界作好实际准备——方式是增加更多的驱动硬盘,将它们安放在重兵防守的大楼内的搁架上,在地理位置上尽可能地接近用户以减少应答时间。谷歌的主要竞争者雅虎和微软现在也已经认识到,数据中心的安全有着极端的重要###,事关它们的前途,于是也开始向谷歌学习,建造了自己的数据中心,但它们的步骤显然太慢了。
谷歌的管理者并没有将现在四处开花的数据中心建设视为显示屏上不久就会消失的信号。谷歌希望我们把更多的习惯于保存在办公室电脑或家里的电脑上的信息转移到集中的地方——如谷歌的服务器上去,它还希望我们把目前保存在纸上的信息数字化,这都需要建设更多的数据中心。在线视频的流行也提出了建设更多的数据中心的要求——视频所形成的文件比文本文件要大得多。
由于在领头建造属于自己的数据中心基础设施方面积累了经验,谷歌现在已经把不断增加新的数据中心纳入了常规工作范围。施密特将这个过程描绘得甚是简单:用服务器将一座大楼塞满,然后接入头顶上的电线。根据需要重复这一过程。
在谷歌,佩奇和布林这两名从前的学生创建了一个为自己开发系统工具的软件公司。由于具备了成批量建设###能价格比优良的数据中心的能力,谷歌开始拥有无限制地扩大数据库容量、不间断地与Web发展相适应的手段。无论公司的业务量增长有多快,都不会出现能力与要求脱节而使新的服务内容被迫拖延的现象。公司也不会由于地方上有人反对而取消新的数据中心的建设计划或被迫迁址。这样,公司就可以扩大,扩大,再扩大。但它也在一些用户和许多###权倡导者当中引发了越来越多的焦虑气氛,当他们看到数据中心正在成倍增长,于是便开始关心谷歌将怎样使用存放在它的数据库的所有数据,因为其中的私人数据是如此之多。
为了安抚公众的焦虑心情,谷歌满可以将它的运作方式公开,甚至就像IBM在20世纪40年代那样,把机器放在玻璃窗后边。但谷歌的管理层对公司的硬件信息讳莫如深,甭说将设备向过路人展示,就连对新闻记者也深藏不露。(我要求把我的脑袋伸进门内瞧一眼,只瞧5秒钟,也被拒绝了。)谷歌的一名发言人说,谷歌的管理层坚信,他们的硬件专家向公司提供的都是最具竞争优势的产品,如果让其他公司的人都向里边瞄上一眼,这种优势就会风化,即使是通过新闻记者的眼睛,也是如此。当然,保守机密是任何高竞争行业的规范,尤其是在技术产业中。但即便如此,谷歌对秘密的态度还是与众不同。
在公司创建时所确立的最终使命——将世界上的所有信息组织起来——的指引下,谷歌所建立的贮存能力已经使它能够通过各种综合的途径对用户所想和所做加以掌控,这是其他公司都不曾做到的;它还可以永远保存这些记录,而不必为了保存新信息而删除旧记录。不仅如此,谷歌还通过将它自己私有的软件公式表述为“我的”以及窜改数据以达到区分其服务的目的,对技术也狂热地防止竞争对手的觊觎。这就导致了谷歌使用“黑匣子”(对外部完全不透明)的愿望与用户们对公开透明的希望之间的冲突。
用户们希望谷歌至少也应公开一下它为保护他们的###信息都采取了哪些措施。用户们对保存他们个人资料的机器以及谷歌公司里能够接触这些资料的雇员抱有好奇心也是很自然的,用户们还会担心个人信息有可能被泄漏、被盗窃,或在政府有关部门的明确要求下转让给他们。怎样才能让用户确信他们的个人信息不会以他们绝对不愿意的方式被用于他们绝对不愿意的领域?对###权关心的问题存在于所有的互联网公司,但这些公司最关注的是个人信息是从哪里流入谷歌这个最大的池塘里的。这使得谷歌机器的日常管理成为公众感兴趣的一个问题。
无论藏在那扇总是紧锁着的大门之后的东西有多么险恶,无论它是应当如此或不应当如此。为了改善其公众形象,谷歌应该有可能会发发慈悲把门打开,至少应该让人可以向里边瞥上一眼。至于数据中心“在黑暗中”运行、旁边没有人等,都不能解答谷歌雇员中会不会出现窥探用户活动的捣蛋鬼这一问题。但是多一些开放就能多带给用户一些安心,使他们对视线以外谷歌发生的事情少一些担忧。如果谷歌愿意更多地开放,它就能够证明在公司的日常运行中并没有人为的干预:谷歌的模式建立在自动化的调节上,在谷歌的信息工厂里从事工作的是软件,而不是人。
独步天下的谷歌算法(1)
任何人都可以召唤谷歌主页并动员起谷歌搜索引擎的全副力量,而不必为登录提供任何个人信息。###别、种族、年龄、受教育程度、职业——一切都不必公开。搜索引擎只搜索它所接收的词语,以及连同搜索请求一道传过来的不起作用的网络地址。
谷歌之所以拥有回应匿名提交搜索请求方面的技术,源自其创始者们致力于尽一切可能从网络站点而非用户方提取信息。所谓算法就是为解决具体问题而设立的一套规则:它是用于构建复杂的计算机软件的基础材料。谷歌的PageRank算法就是用于对网页的链接进行分析,辨别某一个页面同其他页面何者名气更大。谷歌的搜索引擎不需要了解用户的任何情况,而只需猜测当搜索语词被键入时用户的心里在想什么。
若能在匿名搜索领域成为一种核心力量,将对谷歌有着极大的帮助,而且这种帮助的方式还是谷歌在创办之初未曾预料到的。随着在线世界以指数次幂的规模持续扩大,在线收集的个人信息飞速增加,用户们已经不安地看到一个又一个公司或蓄意或无意地释放了一些被用户当作个人###的信息。###每泄露一次,人们的提防心就加重一次;于是用户们希望得到承诺,使他们的个人信息受到切实保护。令谷歌感到幸运的是,它的搜索服务不需要了解用户的身份就可以开始工作。
谷歌的搜索方法借重数学模型,不需要个人信息,因而它提供的广告是由搜索内容决定,而不是由人工提交的,这样就能保证广告服务对象的身份不致泄露。谷歌的这种方式使它在与Facebook等社交网站的经济效益竞争中处于有利位置,因为后者向广告商提供的是接近具体用户目标的机会,而谷歌出售给广告商的只是接触被用户视为个人敏感信息的机会。
谷歌优于其社交网络竞争对手的地方在于毋需了解其用户的个人信息就可以完成网络搜索,不过,这个优点却被它在除搜索以外的其他许多服务项目上的扩张行为抵消了;在这些服务——如它的电子邮件服务Gmail——中,谷歌所获取的资料是极其私人###的。谷歌知道,用户们也许会担心它的雇员可以随意偷看谷歌用户的电子邮件。这个问题不仅谷歌有,微软、雅虎以及美国在线的雇员也可以在用户私人的电子邮件中乱翻,而且这几家公司的服务器所处理的电子邮件信息比谷歌要多得多。所以被担心陌生人擅自阅读他们个人信息的电子邮件的用户单独挑出来,这对谷歌的确有点儿不公平。就谷歌而言,它为了让公众放心而采取的措施无论如何也不能完全令人信服。谷歌说,只有一小部分职员被允许接触由Gmail保存的电子邮件,因此它们不会泄露。但是,令人不太放心的是,公司还规定了一些特殊类别的用户,他们的电子邮件是放在谷歌的雇员禁止进入的地方,“无论他是公众人物,还是某个具体公司雇员,还是谁的熟人”。这能禁止电子邮件被陌生人当作消遣物来阅读吗?为维护这一规定而制定的惩罚措施——解雇——足够严厉吗?能有效杜绝这种行为吗?规定公布后,有违规行为被查处吗?如果某个用户的电子邮件被偷,他能得到通知吗?
正如谷歌所断言的,这类担心是没有事实根据的,对某些公司安全缺口的担忧使人们对所有保存用户个人资料的公司都产生了不信任感。尽管2007年的一篇文章报道了Facebook的雇员(而非谷歌雇员)偷看了用户的资料(据推测可能是为了检查可能的候选人的日期),有的人篡改了电子邮件信息,还有的人更换了用户的文件夹的照片,但谷歌的私密###保护措施也受到了越来越多的怀疑。
独步天下的谷歌算法(2)
在谷歌创办时,佩奇和布林还不必有###方面的担忧。他们一心一意地钻研如何让评定网页的过程自动化。他们的方法无疑优于雅虎依靠人工编辑来维持一个用人手挑选的网站指南引擎的运行。谷歌取代雅虎进而赢得领