图片 2

更智能的冷却系统,基本尺度

选购DCIM的四项“基本原则”

如果是购买几台x86服务器或其他常用的IT设备,大多数企业用户想来不会犯怵,因为用得多、见得多,所以都大致知道该去参考哪几项关键配置或参数。然而,换做我们今天谈的DICM,情况就可能没那么乐观了。

那么,有没有一些关键指标可供人们评估和选择DCIM解决方案?答案是有的。本文就试图为用户准备一张神奇的清单,用户可以带着它去“拷问”自己的DCIM供应商。

需要特别说明的是,本文核心内容节选自施耐德电气第170号白皮书——《避免评估与实施DCIM解决方案过程中的常见误区》,在此向该白皮书作者、施耐德电气数据中心科研中心高级研究员Patrick
Donovan表示感谢。

四项基本原则

对于IT解决方案而言,通常来说“没有最好,只有最适合”,因此不同的用户基于需求和预算的不同会做出不同选择。尽管如此,施耐德电气认为,无论是何种规模的用户,还是要确保所采用的DCIM解决方案最好能够符合DCIM技术发长期展趋势,能够无缝扩展并继续应用于下一代数据中心,同时无需大幅更改数据中心的现有运行方法和流程。

基于上述思路,施耐德电气提出以下四个评估DCIM的关键指标

可扩展的、模块化的和灵活的系统

开放式通信架构

标准化、预制化设计

积极的供应商支持结构

1.可扩展的、模块化的和灵活的系统

模块化和可扩展性的优势不难理解,即要支持“边成长边支付”的扩容模式、具有更强大的容错能力以及更短的平均故障恢复时间等。

灵活性的重要性在于,即使数据中心在未来发生演进和变化,软件套件仍能继续保持其效用。如果软件的扩展或升级非常困难且/或成本高昂,那么随着兼容问题的出现或功能的丧失,软件极有可能被淘汰。

以下列出了一些可用于询问供应商的推荐问题,这些问题可帮助您确定他们提供的产品是否具备以及在多大程度上具备可扩展性、模块化特性和灵活性。

1.进行产品升级和增加许可证的成本和流程是怎样的?

2.进行升级时是否必须由厂商提供升级服务?还是我自己安装一个补丁或更新即可?

3.我是否可以只选择目前需要的工具,以后再增加其他工具?还是我必须现在就购置并安装全套产品?

4.产品扩展对我现在的运行流程会产生怎样的干扰?

5.是否可以对报告工具和结果进行定制,以满足我公司利益相关者的需求?

6.在系统中增加/删除IT 系统和基础设施组件的难度有多大?

2.开放式通信架构

这一特性指的是系统能够通过各种不同的标准通信协议与第三方设备和软件进行交互。性能出色的DCIM
系统要求获得全面而且准确的电力、制冷、空间和IT
资源使用状况视图,同时还需要(最好是实时)了解它们之间的相互依存关系。这些先进的现代化系统能够主动搜集所有必要数据,为用户进行规划和做出运行相关决策提供良好的依据。举例来说,如果DCIM
软件无法与某个特定的制冷单元或UPS
通信,它将无法准确判断其容量水平或当前的状态。从而使用户很难或根本不可能实时做出理想的规划决策。如果通信能力有限,则将难以准确回答所有的重要问题,包括应将下一个服务器放置在什么位置,供电/制冷容量将在何时耗尽,或某个更改将对系统产生什么影响等。

以下对供应商的调查问卷,可帮助您确定某个特定解决方案在多大程度上能够提供IT系统和设施系统的完整视图。

1.要求供应商提供他们支持的所有协议的清单。

2.将此清单与需要管理的设备和系统所支持的协议进行比较。

3.说明可使用的API(应用编程接口)的分类或列出所有现在使用的API
以及典型用途举例。

4.要求供应商说明DCIM 服务器和其他在用管理系统(如BMS 或 VM
Manager)之间分享和/或接收数据必须遵循的流程。

3.标准化和预制化设计

标准化设计意味着系统的构建是基于以前的实践经验和经过实地检验和认可的最佳实践。预制化设计则意味着大部分旨在支持软件与电力、制冷和IT
系统通信并解读这些系统的输出数据的复杂编程工作已经全部完成。

简言之,我们应当避免使用基于“一次性专用”设计的高度定制化管理系统和软件。但是,标准化和预制化并不意味着系统不可以定制。事实上,一个设计精良的模块化系统应当能够在不影响整体系统完整性的前提下通过改造工具包来适应特定的需求。

以下列出了为判断系统的标准化水平而需要向供应商询问的问题。

1.解决方案是否采用了一个开放的通信架构?

2.解决方案是否采用了一个可扩展的模块化架构?

3.安装解决方案之后需要完成多少配置或编程工作?请说明安装和运行解决方案时必须具备哪些资源(知识、技能、时间等)。

4.DCIM 服务器能否自动发现包括第三方设备在内的网络设备并对其进行分类?

5.我能否轻松地将我的DCIM 系统复制到其他地点?

6.软件的默认设置是否基于最佳实践和实际使用经验?

4.积极的供应商支持结构

如同评估任何一种企业级软件一样(+本站微信networkworldweixin),我们也应对DCIM
供应商的总体能力和支持结构进行评估和比较。

解决方案安装完毕之后,这些特质会直接影响其长期有效性。供应商在DCIM
市场的投入力度、在行业组织中的活跃程度和协作以及设施与IT
系统之间的交互范围都能显示出用户将获得的长期支持服务的质量和数量。用户应当确信供应商能够在数据中心的整个生命周期之内始终为其提供支持,而且管理系统也将不断更新并在确保干扰最小化的前提下适应不断变化的技术趋势或商业条件。许多供应商都提供这些系统的安装、配置、培训、甚至运行服务。这些服务的范围和成本是在评估阶段需要额外考虑的一个问题。特别是对于那些工艺流程不够成熟、缺乏资源或缺乏必要的知识来自行完成管理的企业组织,这些软件服务可能是确保充分发挥DCIM
系统功能和价值的正确方法。

1.以下列出了一些可帮助您判断供应商支持服务的级别和质量的问题。

2.供应商是否支持广泛使用的开放通信协议,以确保解决方案能满足未来需求?

3.供应商是否建立了面向DCIM
市场的长期战略,或他们仅仅是一个拥有短期市场侧重点和市场退出战略的初创企业?

4.供应商是否以当地语言提供本地支持,以实现对问题的快速有效响应?

5.供应商的支持问题上报流程是怎样的?DCIM
安装和运行服务代表是否接受过良好培训?

6.供应商是否提供DCIM 系统安装、配置、培训和运行服务?

此外,有效的DCIM
解决方案确实能够将其简化和理顺,并提供一个清晰的数据中心系统视图,但是,这一功能的实现还取决于操作人员能否做好他们自己的工作,即遵循正确的流程来安装、运行和维护DCIM
系统。即使是最优秀的解决方案也需要采用完善的管理流程。流程不完善是导致无法获得DCIM
预期效能的一个常见原因。

关于如何建立建立、实施和长期维持关键流程,有以下六个基本建议:

  1. 向供应商了解安装和运行某个解决方案需要具备哪些流程和资源;

2.
将此要求与自身现有的能力和资源进行比较,确定需要新建或增加哪些流程或资源;

3.
如果无法开发新的流程或增加更多资源(参见误区3),则应选择一个与当前能力相匹配的解决方案;

  1. 正式定义新的流程(何人、何事、何时、何地),
    请管理团队分配资源并指定流程负责人;

  2. 重点关注资产管理、系统配置、利益相关者报告和报警集成流程;

6.
从“小规模部署”开始,在开始时只为数据中心的一个小区域(如一个机柜行、区域部署或机房)部署某几个DCIM
功能,然后在此基础上逐步扩展。


图片 1


如果是购买几台x86服务器或其他常用的IT设备,大多数企业用户想来不会犯怵,因为用得多、见得多,所以都大…

未来,新技术将直接影响数据中心整体架构,容量以及交付战略。
云技术,移动性以及可穿戴技术所有这些技术产生的数据,用户都可以接入数据中心进行访问。

最新的思科全球云索引报告显示了数据中心、云利用率的增长速度。

下一代DCIM:

通过科学的看待下一代冷却系统解决方案,企业、组织可以识别对IT可靠性的负面影响产生的孤立气流的问题,提高制冷容量,安装更多的IT设备,并学习如何降低数据中心冷却设备的资本支出。

总结:

【编辑推荐】

二是采用了不充分或不匹配的流程。最终用户应当从长期着眼来规划、创建和支持DCIM解决方案实施流程和日常运行流程。

科学的对待冷却系统:

1.
提供对数据中心电力、冷却和物理空间使用的持续重新优化,这可以帮助节省资金用于扩大现有数据中心或构建新的数据中心。

同时在数据处理的基础之上,可以采用第三方的报表服务引擎来提供增强的基础设施资产信息和动态数据的可视化分析。

三是缺乏必要的重视度、责任归属不明晰,也会导致用户选择的工具套件无法正常提供原有的设计功能。实际上,数据中心设施部门、IT
部门和管理团队均应参与评估阶段的工作,他们必须对企业组织的需求、目标和实施计划达成一致意见,并指定每个流程的负责人。

许多企业、组织正在以一种科学的态度看待冷却系统。
目的是有效的了解数据中心冷却系统管理的科学与技术。
这包括量化必要变更的能力,确定适当的最佳做法,并在数据中心实施气流管理策略。

对于冷却系统的考虑,比如优化动态冷却系统,可以让数据中心运维人员使用更有效的、下一代分析和规划工具来动态管理他们的冷却基础设施,并优化设备性能和可靠性。要想创造一个更“冷”的2018年,业界人士需要从一个更智能的冷却解决方案开始。

  1. 建模和/或模拟数据中心,让IT管理人员和设施管理人员可以分析“假设”场景。

  2. 通过显示资源/资产如何关联,加强资源和资产管理。

DCIM对于数据中心的持续价值:

新的计算流体动力学(CFD)冷却解决方案为管理员提供了一系列技术,将冷却输出与数据中心的热负荷精确匹配。
使用CFD和智能控制 –
您现在可以将监控基础设施从几个独立的传感器转变为云仪器环境,可以帮助监控每一英寸的闲置空间,最令人激动人心的部分是整合,
这些动态和主动的管理解决方案使集成DCIM解决方案。
由此,数据中心监控管理选项大大增加。
现在,您可以从桌面或手持设备中获取IT机架上所有服务器的库存和运行状态。

选择、部署DCIM解决方案经常存在的误区:

优化动态数据中心冷却系统

当下数据中心管理和可视性比以往任何时候都更重要。
我们正在集成云,虚拟化和整个基础设施组件。 我们不仅仅是监控环境变量 –
我们正在更加关注工作负载,用户访问和数据。
所有这一切都转化为一种新型的DCIM解决方案。

如前所述,与优化动态冷却技术的集成,会使冷却系统应对突发问题。通过创建策略,允许动态配置和取消配置进入机架和数据中心的许多不同资源。
最后,DCIM允许更好地控制分布式数据中心模型。
我们正在构建一个没有墙壁的管理解决方案,能够与内部部署和云解决方案集成。

为了深度挖掘DCIM系统产生的海量数据,可以通过机器学习领域经典算法的实现,如聚类、分类、推荐过滤、频繁子项挖掘等发现数据的相关性和规律。其中Mahout是最知名的基于Hadoop之上的分布式数据挖掘和机器学习工具。

通过研究发现,最终用户在评估和部署DCIM
解决方案的过程中容易存在以下三类误区:

所有这些都趋势,都将意味着数据中心需要配置高密机柜,更多的功率需求以及更好的冷却解决方案。
考虑到这一切 – 让我们来看看以下五种方法能让2018年的数据中心更冷。

关键是要了解,数据中心内的冷却系统可能是一个波动点。
这就是为什么数据中心要快速应对业务需求,市场以及整体数据中心生态系统的需求是很重要的。

3.
实现更高的能源效率。单从能源成本节约来看,就足以让企业考虑采购DCIM工具,更何况这些工具还提供其他好处,而这些好处可能更难以量化,例如改进工作流程。

2.
整合IT与数据中心设施管理。这有助于拉近IT管理人员和设施管理人员的距离,为他们提供信息和分析,让这两个相互关联的职位重新走到一起。

通过这些数据,可以更智能的处理这些海量事件,将事件相关性分析、联动等业务决策从应用程序代码中分离出来,一个智能的复杂事件处理引擎(Complex
Event
Process)是最佳的选择。CEP接受从流数据平台过来的数据输入,解释业务规则,并根据业务规则做出业务决策,实现事件过滤、合并、分流、定位、告警等服务。

面对未来的海量数据,DCIM管理系统不能仅依靠少数几台机器的升级(Scale-up,纵向扩展)满足数据量的增长,必须做到横向可扩展(Scale-out),既满足性能的要求,也满足存储的要求(包括结构性数据、非结构形式、半结构性数据);由于服务需求的多样性,平台既要支持传感器数据流的实时分析与处理又要支持复杂查询与深度分析所需的高性能、低延迟需求。平台需具有高度容错性,大数据的容错性要求在作业(Job)执行过程中,一个参与节点失效不需要重做整个作业。机群节点数的增加会增加节点失效概率,在大规模机群环境下,节点的失效不再是稀有事件。

记住,我们不是简单地创建更好的数据中心冷却系统;
而是在创造更智能的数据中心冷却系统,
重要的是要知道数据中心是一直持续变化的,
通过环境管理系统,是保持一切运行最佳的好方法。这里,有很多都新的DCIM功能,可以让您更好地了解数据中心的各个方面。
通过这些监控数据分析,您可以做出积极的决定,并相应地计划增长。

在DCIM的解决方案中,所有设备动态数据都接入的监控系统,数据在上传到DCIM大数据平台时包含大量的事件,流数据处理引擎也会根据定义的规则产生大量的事件,而这些事件存在密不可分的相关性。

  • 未来5年,全球云IP流量将几乎翻一番(3.7倍)。
    总体而言,从2015年到2020年,云IP流量将以30%的年均复合增长率增长。
  • 由物联网驱动,到2020年,任何设备创建(而不一定存储)的数据总量将在2020年达到每年600
    ZB,高于2015年的每年145 ZB.数据创造了两个数量级 数据存储。
  • 超级数据中心将从2015年底的259个增长到2020年的485个,到2020年将占所有安装的数据中心服务器的47%.
  • 到2020年,全球云计算流量将占总数据中心流量的92%以上。

因此在大规模机群环境下,系统不能依赖于硬件来保证容错性,要更多地考虑软件级容错,同时增加系统的可用性。系统的开放性也是十分重要的,各子系统之间数据交换、共享以及服务集成是必不可少的。

一是选择了不恰当的解决方案。目前市场上DCIM
供应商和解决方案(+微信关注网络世界),而且数量还在不断增长。这些DCIM方案看起来又相同又不同,往往令用户感到困惑。不管怎样,选择具体DCIM方案时,用户应该考察该DCIM方案是否具备某些基本特性,例如可扩展性、模块化、标准化、预制化、开放式通信架构,等等。

下一代DCIM对于IT企业重要价值:

图片 2

时间如梭,无论你相信与否,一年过半,我们已经来到了2017的下半年,各大企业、组织都对数据中心未来的发展项目中投入大量的人力、物力。数据中心的发展由于未来数据信息变得越来越重要,数据中心发展的重要性以及复杂性也随着需求的变化日益增长。比如,日益增加的工作负载是与不断推出的大量应用程序相关。

想要从数据中提取有用的信息,必须拥有能对大规模历史数据进行分布式和并行分析的平台。大数据分析子系统在分布式并行计算技术、复杂事件处理技术和机器学习的基础上,针对采集到的历史数据做智能处理和分析,并对未来可能发生的故障做出预测分析。