各种媒体上关于Google的数据中心有很多文章,包括他们怎样进行数据中心的运营、管理和分析,造成了一大批Google的神话,但这里有些并不准确,这是我从与Google的工程师与数据中心生态系统的专家们讨论后得出的结论。 虽然表面上看Google正在做的就是数据中心的{zj0}实践,但并非总是如此。Google数据中心的运转是为他们的业务——广告收入而服务的。而重要的是你的数据中心应该为你的企业服务,而不是为了Google。每当我谈到这里,总是会听到一些数据中心的专业人员叫着“天啊”,这让人无法理解,因为用苹果(Google的内容交付)和桔子(企业应用)相比是不公平的。你的目标和Google的并不一致,你以可用性和可靠性为重点,而Google 则更重视对可用性的成本控制。 闲话少说,下面就是我所认为的Google数据中心的五大神话。 神话1:Google的业务关键应用和广告系统都运行在PUE 1.2的数据中心上。 这大概是{zd0}的神话。Google运行着两种类型的IT系统:内容交付和关键业务服务。让我们来看看Google这两种类型的数据中心各有什么目标。 首先是内容交付,这是一种基于Google文件系统与MapReduce模型的软硬件系统,是YouTube、GMail和Google Apps保存所有数据的地方。内容交付系统必须保证绝大部分时间可用,但Google早已为一些冗余故障和断电问题设置的是一些道歉的消息。在这种环境里他们可以这样做,因为这里可用性并不是头号要求。内容交付系统遵循的原则是成本最小化利润{zd0}化,这些确实是PUE非常非常低的大型设施。 关键业务服务包括Google的内部事务,比如保持企业的日常运行(客户管理和人力资源等内部系统),以及他们用来发布广告和收钱的广告系统。如果没有这些系统,Google作为一个企业就不存在。这些系统是异构的,各种软件包运行在各种各样的常规硬件上。这些系统可是Google的命脉,因此可用性是{dy}位的。这些常规设施的{zj0}实践的PUE大概在1.5和1.9之间,Google从没有透露有关这些设施的资料。 神话2:Google使用PUE作为管理数据中心的主要指标。 虽然PUE的确是Google的一个重要指标,但它更多是充当衡量怎样把成本降到{zd1}的手段,Google的工程师们告诉我他们还是根据“业务单位”(比如YouTube和GMail)的单位收益率来衡量的。当然我很赞赏Google纳入PUE这个指标,但希望他们会公开承认管理IT底层架构的真实方法。 神话3:Google使用可再生能源来给数据中心供电。 虽然Google确实使用可再生能源来给许多设备供电,但这些设备目前没有任何迹象表明这些设备是大量用在Google的数据中心里的。即使是{zxj}的太阳能设计(这来自艾默生而不是Google)也只能给数据中心提供16%的小部分电力,而且使用太阳能还要面对太阳下山的问题。 当Bloom Energy拿出小型的电池盒Bloom Box时,他们称Google已经测试了18个月,测试是在Google山景城的总部进行的,而且他们说已经Bloom Box是98%可靠的(可用的)。虽然这是燃料电池在扩展性和可靠性的伟大一步,但目前的可靠性还不足以支撑任何数据中心。当许多记者发现Google是他们的客户时他们立即得出结论说Google的数据中心已经在使用了。不,这不是真的,他们只是测试而已。 神话4:Google battery-on-server(服务器上的电池)技术提供了一个更强大的能源备份解决方案。 Google的内容交付数据中心的服务器设计包括了一个铅酸电池备份的12V系统,而不使用中央UPS。这种电池据说可以在断电后几分钟内恢复供电,但注意,如果不成功,还需要另外的备用发电机来供电,这是Google在数据中心效率峰会上特别指出的,“如果发电机在几分钟内无法启动,这说明你有更xxx烦,因此{zh0}有一个以上的断电保护策略。” 这重新回到可用性与效率的选择上,Google再次选择了成本。传统的UPS电源系统可以支持数据中心一个小时或更多,电池系统则可以将运行时间延长的更长。battery-on-server基本上不能扩展,但它确实提供了一个分布式的电池备份,xx了传统设计对中央UPS的需要。 神话5:你的数据中心应该准备与Google同样的标准。 让我们来看看,Google的内容交付数据中心在xx一样的物理架构上运行着单一应用。但你的数据中心中运行的是ERP、CRM、HR、交易和网络应用。这些应用具有不同的架构以及在服务、可用性与性能上的不同要求。 虽然Google的内容交付数据中心在执行任务时的表现非常好,但它们与一个运行关键业务的企业数据中心是截然不同的。管理好你的团队以及员工做好沟通是更重要的,因为这时候谈论“我的PUE比你更低”或者“我的PUE和Google相同”是最没有意义的,因为你提供的服务和Google所提供的xx不同。 除了这五个,当然还有更多的神话。但我们应该了解的不是怎样追随某个内容交付系统,而是如何{zh0}的运行企业数据中心,而并找出优化企业的{zj0}实践。 |