中国人民银行发布的《金融数据中心容灾建设指引》(JR/T 0264—2024)已于2024年7月29日正式实施。这一金融行业标准对金融数据中心容灾建设中的“组织保障、需求分析、体系规划、建设要求、运维管理”进行了规范和指导。面对不断增加的各类网络、业务、应用和数据风险,金融机构究竟该如何更好地规划、建设、运维其容灾系统,实现长期可持续发展的战略目标呢?
下面,就让我们听听业界的“大咖”们都怎样说……
迈入数智化新时代,金融行业正在全面推进数字化转型、信创、人工智能应用等,无论是业务模式还是技术架构都发生了很大变化。美创科技副总裁顾皓天将金融行业连续性强诉求和灾备资产散杂多乱的矛盾,归纳为以下三个方面:信创国产化带来产品、技术形态的百花齐放;云生态、云原生在资产类型、技术形态、数量规模等各个方面颠覆了传统数据中心;数字化变革让数据规模呈现海量化。
金融行业多年来一直十分重视容灾建设,相关监管机构陆续发布过多项标准、规范、指南等。顾皓天指出,此次最新发布的《指引》进一步强调了灾备的日常运营、精准匹配切换预案、保证灾难切换成功率,以及最小化灾难切换时长等。
出于对业务连续性的高要求,以及在技术创新的推动下,金融行业的容灾建设与运维呈现出很多“新意”。
“拿捏”云容灾
相比传统的容灾解决方案,云容灾由于具备更高的自动化程度、更灵活的扩展能力、更低成本等优势,得到了越来越多企业客户的青睐,金融行业的客户亦是如此。据SNS INSIDER预测,2023-2030年,Cloud DRaaS市场的复合年增长率为24.2%,到2030年整体规模将达到426.8亿美元。
这对于云服务商以及容灾方案和工具的提供商来说是一种积极的促进。他们在云容灾的技术和服务上锐意创新,覆盖数据的迁移、数据的备份与恢复、数据统一管理、数据智能化等。当前由于混合多云的接受度越来越高,多云环境下的跨云容灾,以及如何更好地发挥云的优势确保业务连续性,并加强容灾演练成为研究重点。顾皓天分析指出,基于金融行业的特点和需求,在云容灾方面,他们当前更专注于云原生、私有云的容灾备份等。在实践中,美创科技基于新一代灾备一体化平台(DRCC),帮助银行、证券、信托等金融单位建设容灾备份能力及灾备运营管控能力,保障业务RPO/RTO目标。
AI在灾备领域已崭露头角
当前,人工智能(AI)技术正在加速向各个行业和领域渗透,容灾系统建设也不例外。AI技术能够有效优化灾备系统的建设,并提升预警能力等。顾皓天认为,数字化是人工智能应用的基础。AI正在容灾系统建设与运维的诸多环节发挥积极作用:基于日志、错误、资源使用率、变更等上下文数据关联分析,给出智能化灾备告警分析;结合灾备告警分析,智能推荐灾备预案;采用大模型建立运维知识库。
举例来说,美创科技利用AI技术构建了智能监控和预警系统,实时监测系统的运行状态,以便及时发现潜在的风险和异常情况。结合大数据分析与机器学习算法,系统能够自动识别异常模式,提前预警。再比如,美创科技应用AI技术实现了自动化的运维管理。通过机器学习和自然语言处理技术,系统可以自动执行日常运维任务,包括数据备份、故障排查和系统恢复等,从而提高了运维效率与准确性。
灾备建设与运营 “两手抓,两手硬”
以前,人们的关注点大多集中在容灾系统的建设上,包括:需求分析、容灾中心的规划和建设等。但是若想容灾系统在自然灾害或系统故障发生时能够真正发挥作用,成功切换和恢复,容灾系统的运维、运营至关重要。
“金融行业的灾备运营已成为日常运维管理的必需组成部分,包括灾备预案设计、灾备资源巡检、灾备模拟演练、灾备实战演练、系统可观测性建设等。”顾皓天表示,“运维一体化可观测体系建设是新趋势,让人看见、让人干预、让人的智慧推动安全能力的发展是努力的方向。美创科技通过持续的创新,致力于通过可观测性体系持续不断地看见未知、看见未来;通过持续看见确定性,构建面向未来的运维、容灾体系,不断增强运行安全的韧性。”
中国人民银行总行对人行分支机构的灾备建设有突击检查机制。在2023版中国人民银行总行发布的政策文件中,突击式应急演练涉及的业务系统更多,切换流程更复杂,且RTO要求更高。因此,借助工具自动化完成演练,成为中国人民银行各机构灾备建设运维的新趋势。
美创科技已助力全国多家人行分行应急切换管理系统建设,实现了业务连续和监管合规需求,并获得充分认可。中国人民银行华南某省分行根据授权在其周边三省履行中央银行职责。该分行携手美创科技共同开展了演练切换。
该分行选择对生产系统进行业务级演练切换:将4套核心生产业务切换到灾备机房,以验证银行灾备建设的成果,确保演练过程满足央行监管要求,同时提高灾备运维团队的协作能力。
演练切换前,美创科技已协助该分行在测试环境中进行了多次评估和验证。在演练中,模拟了真实突击监管抽查场景:现场值班人员在获取管理人员提供的安全码授权后,快速通过美创灾备一体化平台(DRCC)进行一键切换操作;切换完成后,由灾备中心继续对外提供业务并持续运行一整天,在验证灾备正常可用后,选择第二天晚间进行“一键回切”,以恢复生产业务的正常运行。
最终,在值班人员独立操作下,顺利完成4套业务系统、共计39个节点的一键快速切换和回切,耗时满足央行小于30分钟、该分行10分钟的要求。DRCC平台为本次切换自动生成演练报告,覆盖详细的切换日志、虚拟机截图、命令行回显视频等,证明了切换的真实性和有效性。
“灾备一体化”构建容灾体系
美创科技多年来一直深耕容灾建设领域,并且专注于技术和产品层面的创新演进。独树一帜的美创灾备一体化平台,能够实现灾备状态可感知、灾备能力可订购、灾备演练可掌控、灾难切换可指挥,引领了灾备建设的“五个一体化”的发展,包括“灾备能力一体化、灾备管控一体化、灾备运营一体化、灾备观测一体化、灾备融合一体化”。
通过“灾备一体化”,可以有效提升数据安全性,更好地适应多云环境的需要,不断深化各行业在容灾方面数字化、自动化、智能化的应用,保障业务连续性同时,提升运维效率,为金融行业的数智化转型保驾护航。
评论