随着5G、人工智能、云计算、大数据等新兴技术的飞速发展,数据正在经历爆炸式增长,对算力规模和算力能力的需求快速提升,数据中心向着规模化、集约化、绿色化不断进阶,这对数据中心的建设、运维和管理都提出了更高的要求。
尽管许多企业对在数据中心的投资十分重视,但却往往却忽略了后期运营管理的成本,在提高计算力部署的同时,后期的运维和管理也相当重要。对此,凭借多年来在数据中心运维和管理经验,浪潮信息M6服务器采用了自主研发的服务器远程管理系统ISBMC,可提供硬件状态监控、部署、节能、安全等系列管理工具,ISBMC已支持多种管理接口,这其中就包括IPMI 2.0、SNMPv3、Web GUI和基于RESTful架构的Redfish等接口,通过多种保障来强化服务器自身的管理能力,构建现代数据中心的可靠基础,帮助用户高效地管理算力平台。
基于开放标准 模块化、精细化管理
故事要从1988年讲起,为了摆脱需要人工在数据中心现场运维服务器的困境,行业推出了IPMI作为行业标准,它指定了一组接口,以提供独立于主机系统的CPU、固件和操作系统(OS)的带外管理和监视功能。然而,由于技术不断发展优化,有越来越多碎片化的需求,致使特定的解决方案不能满足向外扩展的数据中心用户的功能和安全需求,IPMI也在2015年后便不再更新。此后迎来了Redfish的新时代。
Redfish是由国际标准化组织DMTF(Distributed Management Task Force,分布式管理任务组)发布的开放式行业标准规范,旨在对平台硬件进行现代化和安全的管理,由多个软硬件厂商参与,在标准设立之初就设定了四项基本目标: 安全、高可扩展管理、可读取界面、基于现有硬件可实现。目前,浪潮信息已成为DMTF Leadership 会员和Redfish Promoter 会员。Redfish标准的应用让众多互联网、通信、金融客户可以更加方便快捷的对超大规模的数据中心进行管理和运维。标准开放的接口,为客户数据中心构建了一个开放的生态,大幅度降低运维难度,但是基础的功能实现,并不是浪潮信息研发团队的目标,“源于开源、高于开源”,让生态有更强的活力,为客户带来更多价值,才是浪潮信息服务器研发团队引入Redfish的“本心”。
据统计,企业IT设备的更新频率一般是3-5年,那就意味着每台服务器的生命周期要达到3年以上,可想而知,周而复始每天对服务器状态进行不间断监控,定期对服务器出具安全性能检测报告,特别对于超大规模数据中心而言,无疑是需要投入大量的人力和精力。所以,浪潮信息的工程师决定通过优化产品设计,寻求突破。
想打造具有高可靠、高可维护性的服务器,以解决上述超大规模数据中心客户的运维难题,就要用好Redfish的特性,通过覆盖Public、AccountService、SessionService、Chassis、Systems、Managers、UpdateService、TaskService等功能模块,定义不同接口的URL,让服务器的管理实现模块化和精细化。
依托自身技术优势,浪潮信息在M6系列服务器ISBMC固件上遵照Redfish 1.8.0规范和Redfish 2019.2 Schema进行开发,ISBMC不仅在Redfish标准的节点资源有较高的覆盖率,还结合浪潮服务器自身特性功能及客户领先性诉求,进行功能开发,如通信行业客户对包括lldpService、电源设置、部件信息获取与设置服务器在内的上百个需求功能点,以及头部科技行业客户的通电开机策略、多个Redfish故障诊断需求等。
为了让大多数企业也可以享受到先进技术带来的便利,浪潮信息也将先进的功能融入到ISBMC通用版本,同时增加更多的系统监控动作帮助客户解决运维和管理难题,实现包括用户管理、获取服务器信息、管理模块信息、配置服务器、修改BIOS、升级固件等功能,可提供硬件状态监控、部署、节能、安全等系列管理工具,以标准化接口构建更加完善的服务器管理生态系统,确保服务器底层硬件和固件的安全。浪潮信息同时开创了特有的异步多线程Redfish架构,实现了Redfish的高度模块化,可快速地实现跨多平台移植,并在响应时间、并发数等接口性能参数上相比上代产品有30%以上的提升,API平均响应小于100ms。
打开上帝视角 让运维更简单
攻克了单一产品的难题后,浪潮信息工程师也在从数据中心的整体运维上进行思考,通过与大量的大型数据中心客户交流发现,数据中心的运维工作大量集中在问题爆发后解决的过程中,而在解决过程中对日志的排查、机器的检测、系统的修复等工作需要不断反复,这给运维人员的工作造成了极大的挑战,而且问题一旦发生必将对业务造成影响。如何解放运维人员的双手,让问题在没有发生前就能有效解决,坚守现在,预见未来,让运维人员打开上帝视角,是数据中心运维的终极目标。
所以除了产品本身,为了给客户提供多维合一的自动管理方案,浪潮信息推出面向数据中心的集中管理软件——浪潮信息物理基础设施管理平台(ISPIM),并采用了Redfish作为主要通信协议。ISPIM具备资源管理、故障监控、性能监控、能耗管理、自动部署、报表统计、网络拓扑和3D视图等功能,可同时对数万台不同品牌服务器、存储、网络等设备进行统一监控、运维、告警管理,运维效率提升2倍,基于浪潮信息故障专家库的大数据规则故障诊断功能,可将故障诊断准确率提升到93%,并且可在快速处理故障的同时极大程度降低数据泄露风险,帮助用户打造无人值守数据中心,提高运维效率并降低运维成本,保障数据中心安全、可靠、稳定的运行。
最终,面向数据中心运维的各种痛点与难题,逐一被击破,浪潮信息M6系列服务搭配ISPIM管理软件,基于这一套产品组合可满足企业从单一产品到超大数据中心的由“点”到“面”可管理运维的全链条优化,保障数据中心高效运维,为业务提供高效稳定的运行基础。
稿源:美通社
相关文章