系统规模越来越复杂、组件越来越多、用户的流量不断上升、事件变更指标呈非线性增长……面对不断变化的应用场景,传统金融业的运维方式和手段似乎显得有些无能为力,不仅无法满足互联网金融的建设要求,无法随着业务的需求实现敏捷开发,更不能实现快速持续交付、融合化及互联网化的目标。
失去运维保障,金融业务开展势必会困难重重、寸步难行。然而,摒弃传统的运维方式,什么样的运维方式才能一劳永逸地解决所有问题呢?在IBM大中华区全球信息科技服务部,技术支持服务部副总裁安婷看来,AI技术的出现使得金融行业的运维痛点迎刃而解。智能运维不再是金融行业的可选项,而成为发展的必选项。
为此,IBM联合清华大学智能运维Netman实验室、一线银行数据中心专家共同发布了首部《金融行业AIOps智能运维白皮书》,旨在集合最高端的产、学、研能力,为广大金融机构和企业支招,以人机超融合,推动智能运维的实践落地。《IBM商业价值研究院2018人工智能报告》显示,63%的企业缺乏能够可靠利用人工智能潜力的技能。同时,大多数企业也认为在IT、信息安全、创新、客户服务和风险管理方面采用人工智能可以获得最大的价值。而人工智能的应用在金融服务等数字化程度较高的行业很可能会加速推广。需求与价值的有效对接势必会碰撞出不一样的火花。
复杂IT环境凸显智能运维深层价值
一直以来,金融行业都走在IT技术应用发展的第一梯队。一方面金融行业有着过往30年采用企业级IOE软件硬件基础架构的长期经验,另一方面金融行业也在积极践行开源软件和互联网架构的应用实施。
在迫切的业务需求面前,金融行业传统IT运维仍旧面临着交付效率、运维质量等方面的多重压力。再加上传统金融机构降低应用成本、提高运营效率、提升用户体验以及持续挖掘内部潜力的需求也使得有效解决运维难题显得更为急迫。
为此,智能时代所带来的DevOps、AIOps等方法及技术,正在通过自动化替代传统的工作方式,成为企业安全高效地进行运维和管理工作的重要工具。将AI与业务运维场景结合,可以实现智能化异常监测与预测、智能化告警引擎、自动化故障处置。而通过对数据的有效整合和利用,能够帮助企业建立全新的数字化业务监控指标体系和业务运维考评规范,确保业务管理流程的高效管控。
这与IBM所倡导的AIOps理念不谋而合。而在此基础上,IBM还提出打造“运维大脑”以及构建人机超融合的运维模式,希望以智能运维的方式带来颠覆性的运维思维和效应,从而赋予现有系统智能。
构建智能运维平台打造“运维大脑”
经过多年的发展,金融企业不同时期应用的硬件、软件众多,品牌、架构复杂。IBM智能运维架构,可以帮助不同用户整合不同的IT产品,最终实现智能运维。IBM认为,基于AI的智能运维平台将是未来运维的焦点核心,并将成为数据中心的“运维大脑”。
“运维大脑”通过机器学习可以了解历史数据的运行规律,通过分析和总结系统运维过程中的各种状况和规律,并针对不同应用场景建立模型,可以实现对针对性能指标的异常波动进行提前预警,主动运维,并自动挖掘数据背后的现象,快速定位系统瓶颈,从而为银行的各种应用提供安全防护。
以某全国性大型银行为例,该银行在2016年率先启动IBM智能运维平台项目,每日处理数据增量达TB级,覆盖个人网银、手机银行等重要业务系统,初步建立了数据中心的“运维大脑”。如某一时段发现手机银行发生交易缓慢,而影响手机银行交易缓慢的主要原因是磁盘IO响应时间,通过智能运维平台的切片分析发现该指标的瞬间峰值是平时正常均值的20~30倍,通过应用智能运维平台可以很快定位到故障的根源,从而为故障恢复争取了时间。
人机超融合运维保障企业永续
在过去30年,IBM专家团队在帮助金融客户爆发式成长的过程中,积累了大量运维实战经验,通过人机融合能够将复杂的运维经验转化为抽象的AI语言,即把运维知识沉淀总结为AI平台可以接受的标签数据,再通过AI平台正向反馈和转化成专家知识在运维工作的价值,从而实现人机超融合的运维新方式。
在安婷看来,面临新的形势,能够充分利用最新科技、践行永续理念的企业将先人一步,并有可能成为行业颠覆者和最后的赢家。在这个过程当中,人机超融合运维将发挥越来越重要的作用。
对此,IBM大中华区全球信息科技服务部、技术服务产品管理部总经理孙建钢也提到,智能运维正处于天时地利人和俱佳的时期。IBM作为整个IT运维行业的领先者,过去30多年与金融行业客户共同成长。因此,在未来IBM也将和企业、客户共同努力,将金融行业IT运维水平提升到一个新台阶,实现与用户的创新发展。