在当今企业业务的运营过程中,为了优化性能,IT部门应该评估其首要任务,确定如何选择服务器,并创建最高效的工作负载。
服务器是现代计算的核心。但是,围绕着“如何选择恰当的服务器来承载企业工作负载”的这一问题,有时往往会对企业的管理者们造成一系列硬件选择方面的困惑。尽管当前借助完全同样、虚拟化且集群化的白盒系统来填充数据中心,并管理任何工作负载已经成为了可能,但云服务正在改变企业如何运行应用程序的方式。随着越来越多的企业组织在公有云服务中部署工作负载,本地数据中心需要更少的资源来托管仍在企业内部部署的工作负载。这促使IT和业务领导者们需要从日渐缩小的服务器规模中寻求发掘出更多的价值和性能。
今天,广泛普及的白盒系统正受到由服务器特性所带来的新一轮的专业化挑战。一些企业组织正在重新发掘一台服务器可能确实适合所有应用场景的概念。但是,您企业其实可以选择甚至定制服务器群集硬件,以适应特定的使用类别。
虚拟机整合和网络I/O增加了优势
服务器虚拟化的一大核心优势是能够在同一台物理服务器上托管多台虚拟机,以便利用更多的服务器可用计算资源。虚拟机主要依靠服务器内存(RAM)和处理器内核。由于企业可以将虚拟机配置为可以使用范围广泛的内存空间和处理器内核,因此也就无法精确的确定既定服务器上可以托管的虚拟机的数量。但是,服务器上的经验法则包括选择一台具有更多内存和处理器内核的处理器,这通常允许更多的虚拟机可以托管在同一台物理服务器上,进而有助于提高整合性。
例如,一款戴尔/EMC PowerEdge R940机架式服务器可以托管多达28个处理器内核,并提供48个双倍数据速率4(DDR4)双列直插式内存模块(DIMM)插槽,最多可支持6 TB的内存。一些企业组织可能会选择放弃单台机架式服务器,而偏向于选择采用刀片式服务器作为替代,或者作为超融合基础架构系统的一部分。用于高级虚拟机整合的服务器还应该包括弹性服务器功能,如冗余热插拔电源,以及DIMM热插拔和DIMM镜像等弹性内存功能。
关于如何选择一款服务器以实现高度整合的目的的次要考虑要素是对于网络I/O的更多关注。企业工作负载通常涉及交换数据,访问集中式存储资源,通过LAN或WAN等与用户接口。当多台虚拟机尝试共享相同的低端网络端口时,可能会导致网络瓶颈。整合的服务器可以从快速的网络接口中受益,例如一款万兆以太网端口,但选择具有多个1 GbE端口的服务器通常则更为经济,更灵活,故而可以将其整合在一起,以提高速度和弹性。
上图:在选择一台服务器时,企业需要根据具体用例来评估某些功能的重要性。
容器的整合推动了服务器的选择
虚拟化容器代表了一种相对较新的虚拟化方法,其允许企业的开发人员和IT团队将应用程序创建和部署为打包的代码和依赖在一起关系的实例——但容器共享相同的底层操作系统内核。容器对于高度可扩展的基于云的应用程序的开发和部署非常有吸引力。
与虚拟机整合一样,计算资源将对服务器可能承载的容器数量产生直接的影响,因此用于容器的服务器应提供足够数量的RAM和处理器内核。更多的计算资源通常会允许更多的容器。
但是大量的同步容器会给服务器带来严重的内部I/O挑战难题。每个容器必须共享一个通用的OS内核。这意味着可能有数十个甚至数百个容器试图与同一个内核进行通信,导致操作系统延迟过大,从而可能影响容器的性能。同样,容器通常作为应用程序组件部署,而不是完整的应用程序。这些组件容器必须相互通信,并根据需要进行扩展,以提高整体工作负载的性能。这会在容器之间产生巨大的——有时是不可预测的 ——API流量。在这两种情况下,服务器本身的I/O带宽限制以及应用程序的架构设计效率都会限制服务器可能成功托管的容器的数量。
当许多集装箱化的工作负载必须通过局域网或广域网与服务器之外进行通信时,网络I / O也可能造成潜在的瓶颈。网络瓶颈可能会降低对共享存储的访问速度,延迟对用户的响应,甚至导致工作负载错误。考虑容器和工作负载的网络需求,并为服务器配置足够的网络容量——既可以是一个快速的10 GbE端口,也可以是多个1 GbE端口,这些端口可以集中在一起,以提高速度和弹性。
大多数类型的服务器均能够托管容器,但是采用大容量容器的企业组织往往会选择采用刀片服务器来将计算容量与测量的I/O容量结合起来,将容器分散到多台刀片上以分配I/O负载。惠普企业公司(HPE)的ProLiant BL460c Gen10服务器刀片便是这类服务器的一个例子:其拥有多达26个处理器内核和2 TB DDR4内存。
可视化和科学计算会影响企业如何选择服务器
图形处理单元(GPU)越来越多地出现在服务器级别,以帮助执行从大数据处理和科学计算到更多与图形相关的任务(如建模和可视化)在内的数学密集型任务。GPU还使IT能够在受到更好保护的数据中心中保留和处理敏感、有价值的数据集,而不是让数据流向容易复制或被盗的业务终端。
一般来说,对GPU的支持只需要在服务器中增加一款合适的GPU卡——对服务器的传统处理器、内存、I/O、存储、网络或其他硬件细节几乎没有影响。但是,企业级服务器中包含的GPU适配器通常比可用于桌面台式机或工作站的GPU适配器复杂得多。事实上,GPU越来越成为刀片系统的高度专业化模块。
例如,惠普企业公司的ProLiant WS460c Gen9图形服务器刀片使用具有两个GPU的Nvidia Tesla M60高速外设组件互连 (Peripheral Component Interconnect Express,PCIe) 显卡,4096个统一计算设备架构(Compute Unified Device Architecture ,CUDA)内核和16 GB的图形DDR5独立视频RAM。图形系统通过使用多个图形服务器刀片来支持多达48个GPU。大量受支持的GPU硬件(特别是在GPU硬件也被虚拟化时)允许许多用户和工作负载共享图形子系统。