现代数据中心建设的8项策略

目前,企业数据中心正竭尽全力满足各种动态的业务需求,并采用先进的技术和架构,以改善基础设施的

性能、规模和经济效益。不过,满足这些需求通常需要全盘重新考虑数据中心应如何设计和管理。幸运地是,

许多企业IT架构师和领先的云提供商已经向人们展示更加现代的、软件定义的数据中心的可行性和优越性。

创建更高效、易管理、可扩展的数据中心的下列八个基本步骤。

  1. 切换至模块化架构
  2. 随时随地融合基础设施
  3. 由软件驱动数据中心
  4. 克服商用硬件恐惧
  5. 重视最终用户计算
  6. 打破孤岛,提高灵活性
  7. 创建混合云
  8. 超越灾难恢复,实现服务的连续性

 

  • 懦夫干不了企业数据中心设计。这项工作从来都不简单,而且企业数据中心每年都会变得越来越复杂,维护
    成本也越来越高昂。当然,数据中心架构师并非有意提高其复杂性。实际上,最初在开展基础设施设计时,他们
    也曾试图合理地选择技术和产品,以使整体环境易于管理和支持。

    但是,为了跟上业务发展的脚步,数据中心不断纳入各种新的技术,以便提高性能和规模。其结果是,数据
    中心日益依赖于网络、服务器和存储器孤岛上的各代产品以及互不兼容的技术。加上庞杂的管理控制台、仪表板
    和框架,我们不难发现,如今的数据中心为何如此难以管理、升级成本高昂、几乎无法经济有效地进行扩展。

    目前,许多架构师开始采用模块化设计,以扩展现有的综合体或者创建新的数据中心。模块化设计采用同质
    的“建筑构件”,通过逐步增加建筑构件来达到期望的规模。每个模块均整合了数据中心的基本元素:网络、存
    储器和计算资源。模块化数据中心设计具备如下优点:
    •  与传统的自助方法相比更加简便
    •  对基础设施进行扩展时,能够提供更加可预测的性能
    •  更好的技术互操作性
    模块化数据中心并不是一个全新概念。最早的基础设施模块化尝试之一就是,为40英尺的船运集装箱装载20
    机架或更多的服务器、存储器和网络设备,这些设备均已经预接线缆,随时可投入使用。从技术角度来说,集装
    箱方法符合模块的定义,但是几乎没有企业有能力承担基础设施的这种剧增。

    最近,模块化已经降至机架级。虚拟计算环境(VCE)的vBlock等产品以预先设计、完备接线的机架形式交付,其
    中包含服务器、网络交换机和存储设备。因此,组织机构在创建数据中心时,能够一次构筑一个机架。但是,这种方
    法也存在如下显著弊端:
    • 对于许多组织机构来说,解决方案的定价仍然过高。即使最基本的基础设施通常也都需花费50万美元,甚至更多。
    • 固定的、供应商定义的计算、存储和网络功能比例使得系统不够灵活,无法有效满足数据中心需求。
    • 单一机架含多个供应商的传统产品,使总体管理复杂化。
    • 这种架构难以汇聚各个机架上的资源,因此不具备真正的可扩展性。
         当“建筑构件”能够迅速添加至基础设施、或者从基础设施中移除时,即实现了真正的数据中心模块化。有了模块化
    的“建筑构件”,组织机构便能够避开过度开通基础设施的高昂费用。企业可以从小做起,先创建单一的机架,然后再陆
    续添加平台或设备。
         Nutanix虚拟计算平台提供了一种理想的“建筑构件”,可将计算和存储层合并到单一的综合2U设备上。此外,该平
    台开箱即可利用现有的以太网投资。有了模块化的“建筑构件”设计,组织机构便能够从小型部署项目开始,逐步扩展成
    为大型群集。Nutanix减少了对专用存储网络或阵列的需求,并通过单一的直观管理控制台简化了数据中心的总体管理
    工作。
        基于设备的模块可整合网络、存储和计算资源,利用这些模块创建基础设施,可简单而经济有效地扩展企业数据
    中心。
  •     许多企业IT经理已经认识到融合数据中心基础设施的诸多好处:他们通常能够利用较少的专用资源,更加经济有
    效地提供各种融合服务。
        存储策略的发展演进恰好能够说明融合为何如此强大。十几年前,传统硬盘从应用程序和数据库服务器迁移到集
    中式共享存储阵列,以提高整体的容量利用率。存储域网络等高速网络将服务器连接到这种单片存储器上。
        最近,企业存储设备中又增添了闪存这个新成员,形成了混合存储解决方案。若设计正确,混合存储解决方案的性能可高达传统架构的100倍。部分SAN架构已经成功改造完毕,可适应基于闪存的存储需求,但是这
    种改造通常会带来新的网络瓶颈。举例来说,8Gb/s SAN中添加100张基于闪存、基于PCIe的存储卡,将压跨大部分结
    构网络和阵列控制器。
    谷歌和Facebook等IT行业领先企业认为,NAS和SAN等技术在现代数据中心无用武之地。它们希望计算和存储资
    源能够共存,这样数据I/O端口的延迟才会非常小,而且扩展也不受到太多限制。
    成功删除企业数据中心的复杂存储网络,并将数据和计算有效整合于一个系统中,这还需要采取进一步的融合措
    施。架构师必须从大量操作系统的各种I/O堆栈彻底过渡到少数明确界定的标准协议(例如NFS、iSCSI、CIFS)。
    VMware通过虚拟化实现了这种过渡,而微软HyperV、Xen和KVM则如法炮制。
        通过在融合方程中增加虚拟化,SAN/NAS软件堆栈得以保留在服务器上。有了虚拟化的控制器,所有操作系统支
    持单一实施项目中的SAN和NAS功能最终才成为了可能。现在,所有虚拟机(VM)都能够与存储资源实现透明通讯,
    就像它们通过SAN网络与存储资源通讯一样。不同之处在于,存储器和服务器可以一起扩展,而无须投资于高速专用
    网络。
    Nutanix虚拟计算平台将计算和存储功能融合于单一系统,因此不再需要传统的存储阵列。一台设备含有四个独立
    的节点,每个节点均经过优化,具备高效的计算、内存和存储功能。每个节点均运行行业标准的管理程序以及Nutanix
    的控制器VM,该控制器VM处理本地管理程序的全部I/O操作。存储资源通过NFS等传统界面提供给管理程序。全球存
    储池汇聚所有节点的存储容量,并且群集中的所有主机均可访问该存储池。
       将计算和存储资源融合于单一设备,可提高数据中心的整体灵活性,并尽量降低延迟时间。相比通过专用存储网
    络将单独的服务器和存储阵列连接起来,这种融合的方法既可收获各项优势,同时还消除了复杂性。
  • 传统的数据中心依赖于专门的硬件,功能通常比较单一。其设备可能包括:高效的负载平衡器,基于硬件的存储
    阵列,或者某种可导致大部分数据中心杂乱无章的安全设备。这些硬件平台均缺乏灵活性和便携性。因为它们大多数
    借助于FPGA和ASIC,因此系统无法简便地支持新的软件功能。部分应用软件的运行时逻辑嵌入平台内,平台和应用软
    件之间耦合紧密。由此而形成的基础设施仅针对特定的应用软件,并且难以管理、支持和扩展。

    软件驱动的数据中心将策略智能从基础硬件中解耦,是一种更具扩展性的解决方案。它允许将逻辑和策略管理提
    取到分布式的软件层,该软件层自动操作并可集中管理。因为服务基于软件,所以数据中心管理团队可以随时随地根
    据需要在基础设施上开通新的服务,无须增加硬件。

    将服务逻辑提取到软件,使得组织机构不再依赖于专用硬件。在软件解决方案中纳入基于REST的API和其它软件
    界面,能够形成可编程的基础设施。软件定义的服务可以作为更大的云管理与协调策略的一部分进行界定、开通和管
    理。

    Nutanix采用先进的分布式软件模型。该软件充分利用各种经济实用的商用硬件,例如英特尔的CPU和基于闪存的
    数据存储器。作为一款虚拟的计算平台,Nutanix将企业存储作为服务交付至虚拟层。它将存储变成一种可编程的、按
    需提供的资产,适用于其环境中的所有虚拟工作负载和应用软件。基于REST的API允许Nutanix基础设施自动管理存储
    和计算资源。

    与采用昂贵的单一功能设备的数据中心相比,支持商用硬件平台上提供软件驱动服务的组织机构更加灵活、更加
    有效。
  • 在传统的运营模式下,如果需要提高数据中心的性能,那么开具的药方要么是升级现有硬件,要么用新硬件替换
    现有硬件。时至今日,仍然有许多数据中心规定了大部分硬件的更新周期。每三到五年,IT团队都要用更为先进的技
    术来更换服务器、网络设备和存储系统。废弃功能仍然完善的硬件,用更加昂贵的设备取而代之,这种策略增加了资
    本支出。

    并非所有组织机构都采用这种硬件替换模式。谷歌和其它一些领先的云提供商发现,无需高额资本支出即可实现
    巨大规模的秘诀在于:打破数据中心对昂贵的高性能硬件的依赖。于是,他们采用了可在低成本商用硬件上有效运行
    的分布式软件架构,实现了所需的数据中心规模。

    采用软件驱动策略后,只有当数据中心需要扩大规模或提高性能时,才向基础设施中添加额外的商用硬件。因为
    系统汇聚了群集内所有设备的资源,所以服务器和存储节点不必都是同类最佳产品。因此,当资源需求增加时,组织
    机构无须定期更新昂贵的专属设备。而且,一个命名空间群集范围内的数据和元数据经过复制,使得任何一个服务器
    都不会成为单一故障点。

    采用商用硬件的组织机构必须明确何谓“商用”。举例来说,云提供商和大规模网络提供商认为,只要服务器基
    于英特尔x86,那么采用什么品牌的服务器并不太重要。因此,在选择供应商时,可以只考虑价格和交付时间等因素。

    利用“不浮夸”的服务器创建数据中心,可极大地改变IT的经济性。它开始打造主流企业和领先云提供商之间的公
    平竞争。所幸的是,提供全球最大、最可靠数据中心的那些原始设计制造商(ODM)现在开始直接向大型企业开展销
    售。所以企业IT部门和IT解决方案提供商能够降低硬件成本,但无须降低性能和可靠性。

    Nutanix虚拟计算平台和公共云提供商遵守相同的原则:在商用硬件群集上运行分布式软件,实现大规模和高可
    靠性的目标。Nutanix提供经济实惠的2U设备,采用现成组件制造而成。它采用高性能的英特尔处理器和先进的、不
    易失的、基于闪存的内存。
  • 员工越来越多地将他们的智能手机、平板电脑和基于网络的笔记本电脑带到工作场所。他们希望无缝访问企业数
    据和应用程序。这种IT“消费化”是最终用户计算(EUC)趋势背后的原动力。EUC将数据中心内的桌面、应用程序和
    数据集中起来,从任意地点向任意设备提供这些服务。
    许多组织机构通过桌面虚拟化涉足EUC领域。最近,全面的EUC“堆栈”使企业能够充分兑现BYOD(自带设备)
    承诺,向任意用户设备提供应用程序、桌面和数据。这些解决方案采用的自助服务门户通常仿照消费网站进行设计,
    目的是加速最终用户的采用。
    各软件供应商竞相通过EUC解决方案满足这种新兴的需求,数据中心基础设施也竭力满足这些新的需求。许多IT
    团队按照标准的服务器虚拟化方法打造他们的实施项目。这样可以成功地证明概念,但是全规模生产部署给网络、存
    储器和服务器资源带来了大量的负载,以至于扩展的困难迅速显现。
    例如,VDI解决方案提出了非常高的IOPS要求,需要高性能、低延迟的基础设施,以保证为最终用户提供高质量
    的体验。如果虚拟桌面在相同的通用服务器虚拟化基础设施上运行,那么快速提供桌面所需的资源可能无法获得。在
    需要的时候却缺乏计算、内存和网络资源,这将损害整个VDI投资。
    新的EUC套件整合企业数据服务(例如“网络随身碟[dropbox]”),向最终用户提供“跟我走数据(follow-me data)”,
    从而加剧了这个问题。这些具备EUC功能的数据服务需要基础设施提供更大的存储容量。扩大基础设施以支持整个公司
    的EUC活动,这种做法无法解决问题。
    但是,部署专用的、独立的环境以便专门支持EUC技术,这也不是一个好办法。尽管IT能够更好地控制EUC资源,
    但会存在如下重大弊端:
    • 创建和维护独立的数据中心孤岛费用大,而且通常得不到充分利用。
    • EUC专家通常被指派去维护数据中心环境,因此增加了总体的运营费用。

    创建数据中心基础设施的新方法必须足够灵活、富有弹性,能够满足各种各样的工作负载需求。数据中心必须能
    够应对计算密集型VDI、存储密集型企业数据服务、以及现有虚拟化企业应用程序组合。
    全球的领先企业和政府机构纷纷采用Nutanix解决方案,助力他们的EUC部署项目,并避开常见的陷阱。一台
    Nutanix 2U设备提供的实际计算和存储资源,可支持单一设备中多达400个虚拟桌面。随着VDI环境的发展,更多的
    Nutanix区块将添加进来,以便动态地扩展基础设施。
    Nutanix虚拟计算平台通过PCIe附加闪存和高达20TB的存储容量,实现高效的分层存储功能。它动态汇聚群集内
    所有节点的存储资源,为所有虚拟机提供单一的命名空间。这种分布式的、软件定义的存储策略可支持海量存储的数
    据库,而“数据跟我走”的EUC组件需要这样的数据库。

    为了成功地支持EUC,IT创建的数据中心必须足够强大,以便应对计算密集型VDI;并且足够灵活,以便能够随着
    业务的发展而迅速扩展。有些用户无法容忍停机,有些企业非常灵活,为了满足他们的要求,您需要一个可靠的、易
    于操作的数据中心。
  • 数据中心的目的是为企业运行并提供应用程序。这个任务非常明确,但基本的基础设施还是演变成为了离散型的
    技术孤岛,每个孤岛由一组专家进行管理。举例来说,大部分数据中心都有一个存储孤岛,通过专门的团队开展数据
    管理和信息存档。这个团队定义并管理低水平的、针对特定存储的构件,例如LUN、VOLUME和RAID分区,以支持
    数据中心的总体运营。网络、服务器和虚拟化团队都拥有各自的孤岛,并采用额外的以学科为中心的技术。

    将各个特定的技术能力隔离成为独立孤岛,会使日常管理复杂化,而且还需要在每个隔离的孤岛内单独进行横向
    扩展。这种结构性的僵化使得传统的数据中心无法实现灵活性和进行有效扩展。

    IT学科的快速技术进步还意味着,每个孤岛团队必须不断更新他们的技能,才能有效地履行职责。策略管理指出
    了运行基于孤岛的基础设施的难处:网络团队可能依靠惠普OpenView或者思科数据中心网络管理器(DCNM)监视
    网络运行环境,而虚拟化团队采用的是vCenter运行管理器或者微软系统中心。
    尽管专业化在一定程度上令组织机构受益,但最终的净效应却是数据中心失去效率。由于拥有专业技术的团队之
    间互相依赖,因此即使做最微小变更也需要他们开展密切协调。举例来说,开通服务器资源以支持新的虚拟机,一般
    需要网络团队配置IP地址和VLAN。存储团队开通LUN,并在SAN上分区,以便设备能够互相“看见”对方。存储团队必
    须分配额外的容量,而服务器团队必须指定适当的UID,提供适当的服务资料。有效协调这样一项简单的任务对于大
    部分组织机构来说都困难重重。
    打破这些技术孤岛需要一种不同的策略,一种能够利用灵活的多用途解决方案的策略。而理想的策略是一种融合的
    解决方案,将互相依赖的资源汇聚于单一的可扩展装置。通过整合各种技术,融合解决方案可提取每个孤岛内的低水平
    复杂性,从而使技术管理能够满足数据中心级的目标。
    融合解决方案还简化了策略和资源管理,因此一个数据中心团队便能够应付,无须各种专业的技术。通过同步扩展
    传统的IT域,融合解决方案还可简化数据中心的整体发展策略。
    通过将存储和计算融合于单一设备,Nutanix虚拟计算平台提供了基本的数据中心基础设施,有助于组织机构摆脱基
    于孤岛的IT模式。Nutanix提供了一个功能全面的服务平台,其中纳入了运行企业应用程序所需的全部核心功能。
    融合解决方案将资源汇聚于单一的可拓展装置,降低了对高度专业化的技能的需求,有助于组织机构打破IT孤岛,
    迅速响应动态的业务需求。

  • 目前,企业数据中心正在设计各种私有云,可提供公共云基础设施的许多属性,例如按需开通、应用程序间资源
    共享、以及仍由数据中心团队控制的业务装置。这些私有云既可以内部运行,也可以由服务提供商通过专用的、非共
    享的基础设施异地托管。
    内部数据中心和私有云能够更好地进行安全控制,并使IT团队能够全面负责性能和安全服务水平协议(SLA)。因
    此,内部系统将继续与公共云以及基于SaaS的服务共存。
    公共云和私有云的出现为数据中心架构师提供了切实可行的选择。但是,大多数专家认为,没有一种方法能够单
    独满足企业IT的全部性能、安全、扩展和SLA需求。现代数据中心必须在混合云中同时采用公共云和私有云基础设施。
    混合云可以应对“突发的”应用程序流量。当内部托管应用程序需求超过私有云的容量时,过剩的需求将溢出到
    IaaS环境。因此,所有用户需求都能够得到满足,企业SLA也能够得到保证。这种情况通常被称为云爆发(cloud
    bursting)。
    将来,更多企业将会在两种环境之间分拆数据存储责任。低成本的数据存档将由公共云环境负责,而更加活跃的
    或者“热门的”数据将驻留于私有云,以提供最佳的用户体验。这样可平衡存储性能和成本。混合云还是构建灾难恢复
    能力的切实可行的解决方案。
    通过将计算和存储资源整合于单一平台,Nutanix可提供基础设施,实现安全、高性能的私有云。它提取并汇聚群
    集内所有节点的存储资源。这些汇聚在一起的信息作为一个数据存储存提供给群集内的虚拟机。
    该系统使得IT部门能够按需开通应用程序,并且不再需要手工配置存储资源。Nutanix群集也可以部署在异地私有
    云上,实现企业数据中心和私有云基础设施之间的自动数据复制。
    此外,Nutanix软件架构还可以扩展。它支持通过基于标准的API轻松使用公共云,因此一个Nutanix 空间可同时利
    用私有云和公共云基础设施。
    灵活的全球基础设施灵活的运行时间执行
    企业IT控制最终用户透明度
    私有云 混合云 公共云
    企业托管资源
     
  • 企业灾难恢复(DR)策略通常是反应性的。当天灾或人祸发生时,最终用户发出的应用程序请求仅转移到二级站点。
    在服务中断一段时间后(有可能是几分钟,也有可能是几个小时),应用程序服务将恢复。数据的可用性和恢复是这种方
    法的重点。
    许多灾难恢复方案是由恢复点目标(RPO)和恢复时间目标(RTO)定义的。恢复点目标决定可以丢失多少数据,而
    恢复时间目标决定数据恢复需要多长时间。一直以来,都是这种程序在保证着业务的正常运行,并满足着用户的需求。
    但是,IT消费化从根本上提升了用户的期望。最终用户现在习惯于按需获得服务,要求几乎100%的服务可用性。如果
    IT团队无法满足这种体验水平,那么最终用户可能绕开企业IT,自行获取基于云的服务。为了满足SLA对于常在服务的新
    要求,IT团队必须重新思考如何创建、提供并保护服务。
    提供接近100%的可用性意味着,传统的、以数据为中心的灾难恢复方法必须发展过渡到一种更加积极的、以服务为
    重点的策略,即所谓的服务连续性。有两个战略方法可以实现组织机构的服务连续性。
    1)重新架构数据中心,提高其可用性。这种方法适合大多数传统的应用程序架构,但它们不一定在物理或逻辑上呈
    分布式。比较好的例子包括SAP或企业数据库。在这些情况下,数据中心架构师通常基于城域群集设计主动—主动站点,
    而HA在两个站点之间运行。
    这些站点必须有很大带宽来连接它们,而且往返时间(RTT)比较短,这样基础设施就能够应对延迟敏感型的操作,
    例如独立存储阵列之间的同步复制。如果某个数据中心运营中断,那么举例来说,在数据中心A上运行的应用程序将自动
    转移到数据中心B。这种部署非常复杂和广泛,而且还有物理限制,例如两个站点之间的距离最大不得超过100公里。
    2)重新架构应用程序,使其呈分布式。分布式应用架构越来越普遍。它的主要优点包括:全球扩展能力、性能良好、
    并能够提供无与伦比的正常运行时间。脸谱、亚马逊和谷歌是此项技术最著名的开拓者。
    分布式应用架构使应用程序或服务分布于多个站点、地区和数据中心。如果设计正确,那么其结果应该是单一的全球
    服务,并具备多个可用区和故障域,在站点发生故障时可保持服务畅通。


推荐产品