企业面临的挑战

增长模式的突破

管理模式的突破

转型升级的突破

数字化转型抓手

连接

在线

共享

智能

角色变化

主导转型

每一个业务、功能模板的负责人都是“一把手”(一把手工程)

构建赋能共享平台

共享平台必须以业务为导向(不是管理导向)

端到端的业务流程重构,考虑整体链条

数据支撑

共享平台构建就是管理变革

运维思考

进入数智万物的数字世界,技术本身的追求不应该作为技术团队的价值创造,而是应该围绕在企业价值下重新思考运维价值,由新的运维价值重新设计运维的数字化世界。

IT 运维工作实际上是一个相对数字化的环境:

  • 运维协同网络中面临的硬件机器、软件资产、配置信息、架构、运行状态、业务运营状况等都是比较适合数字化或已经数字化;
  • 运维关键的工作流程有成熟的 ITIL、ISO20000、ISO9001、ITSS、DevOps等方法论推动线下到线上;
  • 运维的很多线下的工作在很多年以前便开始推进自动化、在线化;
  • 配置、日志、监控、流程等数据也有较成熟的技术方案实现集中的持久化。

所以,数字化转型对于运维带来的挑战不是数字化的技术表现,而是数字化转型推动新技术、新场景的快速迭代,让运维面临的复杂度、不确定性因素加大,这与传统运维对于稳定、可靠的追求相反。

传统IT能力体系图

IT 能力

连续性保障能力: 以数据驱动的业务连续性保障与风险防控能力;

客户服务能力: 以客户为中心的“感知、决策、执行”的服务能力;

快速交付能力: 利用敏捷、设计思维等方法,推动技术平台转型,快速支持业务,交付新产品、新服务的创新能力;

生态扩展能力: 开放的场景接入,融入或构建生态的能力;

IT服务能力: 提升IT服务效能,灵活弹性、安全可靠的技术基础资源交付能力;

运营协同能力:构建高效的数字化工作空间,优化资源配置,为运营提能增效。

6大IT能力的建设,需要从组织文化、流程机制、技术平台三个角度制定相应措施,比如在组织文化方面,在合规风控基础上推行敏捷文化,增加扁平化、柔性化、网络化的敏捷组织架构,打造快速响应能力;

在流程机制方面,以数字化协同网络、数据智能、敏捷交付等数字化思维,重塑协同机制等;

在技术平台方面,推动业务中台、数据中台、技术中台等共享能力中心的技术架构转型,推动大数据应用、智能应用、自动化应用、智能风控等数据应用建设,以及建立云数据中心,一体化运维平台等技术平台。

业务连续性保障

结合生产事件的工作经验再总结一下影响业务连续性的因素:变更问题、维护问题、性能容量问题、操作问题/误操作、容灾/应用架构高可用、应用逻辑缺陷、版本控制、产品或功能设计不足、数据质量、高可用有效性、应急方案、技术保障方案不完善、应急预案缺失、应急演练不到位、问题跟踪不闭环、参数设置问题、配置问题、人员技能不足、流程机制不完善、外部攻击、基础设施异常、数据备份、数据丢失、监控发现及时性、故障处置时效性等

1) 以 “连接网络+数据驱动 ”重塑“监管控析”运维平台化能力。 “连接网络+ 数据驱动 ”不仅仅是实现运维数据“采存管算用”的技术能力,而是要以业务为中心,重新梳理与业务互联网络连接的点,围绕业务连续性价值驱动运行数据的在线落地,将上帝视角的数据分析能力融入到“监管控析”平台。

2) 以主动的运行数据分析推动应用架构的健壮性 。通过性能、容量、安全、可用性、业务感知、客户反馈等运行分析评估数据,辅助研发团队发现线上潜在问题,在异常问题爆发前优化应用,提升系统健壮性。

3) 加强应急管理、可用性管理能力,推动运维前移,加强应用架构非功能性设计

4) 落地敏稳双态的运维模式 。敏稳双态的运维模式将长期并存,针对不同态的应用系统建立不同的连续性保障方式,稳中求稳,敏中求快。

5) 优化协同机制 ,采用运维工作场景全在线的方式提升运维工作的工作在线、操作自动化、可视可控。

6) 持续推进运维组织人员能力建设,建立学习型组织 ,推动可用性、稳定性为目标的 SRE 模式。

7) 云化基础设施 ,提升基础设施的稳定性、高可用、安全性、弹性伸缩能力。

8) 建立混沌工程 ,主动检测、演练、发现、修复影响业务连续性因素的风险。

9) 加强数据应用 ,健全应对新技术风险的信息安全防控体系。

提升业务交付效率

考虑分解以下三条价值链路:

1)IT需求交付价值链(项目、需求、设计、研发、测试、发布)

2)IT服务交付价值链(SLI、SLO、SLA、服务目录、服务请求、服务响应、服务反馈)

3)IT系统退出(投入收益指标化、运营、评估效能、启动退出、释放资源)

可以考虑从以下几个角度切入来提升交付效率:

1) 从业务需求及产品设计角度,更快的感知客户需求,准确挖掘痛点,利用设计思维及MVP等思路引导业务构思,建立敏捷型的产品研发模式,加快业务交付效率。

2) 运用更灵活的中台架构,比如中台架构的可复用、可共享、组件服务化,沉淀业务逻辑及技术标准,加快前台应用的敏捷。

3) 推进更先进的应用架构,比如云原生方法论,包括容器化、微服务等,全面向云化的技术架构转型。

4) DevOps的持续交付能力建设,推动全链路的持续集成,持续发布工具链及协同模式建设。

5) 利用混合云的基础设施,发挥云计算弹性、灵活、自动化等特征,屏蔽基础设施的复杂性。

6) 建立数字化的系统投入与收益评估模型,推动系统退出机制,释放资源投入到业务需求。

从上面几点,我觉得运维可以重点围绕:利用运行数据运营分析辅助业务决策(第1点)、推进持续交付中的持续发布能力建设(第4点)、云化基础设施(第5点)、建立系统退出机制(第6点)。

如何做

利用运行数据运营分析辅助业务决策

推进持续交付中的持续发布能力建设

云化基础设施。云计算将传统硬件、系统软件等复杂的基础设施资源进行整合和自动化,过滤技术细节,为上层面的应用场景提供简单、按需、所见即所得的基础设施服务,极大的提升研发工作效率、减少重复建设、提升资源利用率,且平台对资源需求的弹性支撑有助于保障应用系统更有效的应对市场行情的波动。

云平台通常采用混合云模式,可以考虑以私有云建立完整的 IAAS和PAAS,并根据业务需要引入行业云、公有云,其中涉及敏感数据的应用系统部署于私有云,非敏感信息部署于行业云或公有云。

建立系统退出机制。随着企业 IT建设不断建设,只上不下的模式将大大占用IT资源,系统数量的不断增加需要配套投入更多的人力、硬件、正版化软件、网络带宽、基础设备等资源。按国家计算机相关认证考试评估,软件上线后的IT运行管理阶段是SDLC(软件全生命周期)中持续时间最长,投入最大的阶段,约占60%-80%。

以数据驱动的方式加强IT运营管理将有助于提高应用系统运营效能,通过定期识别并释放低效能业务系统资源,将有效IT资源倾斜到高效能的应用系统,以此来提升IT交付业务的效率。

提升 IT 服务质量

将ITIL作为ITSM的指导思路,并形成一个信息化的IT服务管理系统。

ITIL一共有5个版本,分别是:ITIL V1,ITILV2,ITIL V3,ITIL 2011,ITIL4。大体看,V2以前主要提倡流程管理的思路,V3以后则强调IT服务,服务则涉及服务战略、服务设计、服务转换、服务运营、持续的服务改进。

最新的ITIL4,在原来的版本上整合了一些敏捷、DevOps、精益、IT治理、领导力等工作方法,将IT组织内的运维、研发、测试与IT组织外的业务、客户的协同整合到了一个整体的方法,提供一个数字服务的管理模式。将ITSM向企业扩展,就形成了ESM(企业服务管理),即将企业内标准化能力服务化,提供相应协同输出的服务能力。

建立评价 IT服务质量的管理模型

建立全在线的IT服务交付模式。对关键的 IT 支持服务以流程方式落地,可以借鉴 ITIL 的服务提供流程和服务支持流程,其中服务提供流程包括服务级别管理、财务管理、容量管理、 IT 服务持续管理、可用性管理等,服务支持流程包括配置管理、事件管理、问题管理、变更管理、发布管理等;

其次,随着 IT 成为日用品,企业对 IT 需求越来越多,传统的支持服务流程将无法满足业务需求, IT 需要具备快速服务化 IT 支持能力,推动 XAAS (一切皆服务);

同时,服务化 IT 支持后,还需要线上系统支持服务的交付,交付模式即将人(服务需求方、服务供应方)、事、系统利用线上方法连接起来;最后,全在线的 IT 服务交付模式沉淀了数据,需要利用数据运营来推动服务交付质量的持续提升。

搭建IT服务管理系统 。IT 服务管理系统通常的组成部分包括:服务台、故障及变更等关键流程、配置管理、服务目录、知识管理等,其价值主要有:

确保IT流程能够支持业务流程,提高业务运营质量。

通过核心的流程的保障能力,为业务提供可靠的业务支持。

将IT服务以SLA约定,让业务对IT服务质量有明确的期望,并清楚需要的付出。

标准化并线上化IT服务,加强IT与业务的协同,让IT更好的服务于业务。

全在线IT服务获取与交付,提升客户/业务满意度。

建立统一的IT服务目录。在IT组织内部将IT能力标准化,形成服务目录,企业中用户能够像进入电商系统上,找到自己所需要IT支持的服务,并申请服务,同时用户能够在线获得服务的反馈,并利用社交化的手段对服务水平进行评价推动IT服务质量的持续提升。

IT服务目录是将IT所有内部、外部服务加以整合、标准化,为服务供需双方提供线上连接的工具,并与服务台、知识库、自动化、云平台等连通,提供人工、半自动化、全自动化多样的能力。服务目录主要为了应对以下问题:

  • 业务不知道IT能够提供什么服务,有些业务认为和“电”相关的都和IT有关,有些认为只有软件开发才与IT有关。
  • 业务、IT对于IT服务的定义或期望不匹配,是否所有系统的可用性都应该是4个9,所有IT需求都应该是一周内迭代上线?
  • IT作为成本中心,源源不断的消耗公司资源,IT价值是好是坏如何衡量?IT服务是否有成本?有限的成本应该往哪个方面倾斜?
  • 以成为中心为基础的IT组织充当被动的角色,缺少可量化的服务质量水平与清晰的计划,主动的持续优化服务质量
  • IT服务的支持以经验导向为主,IT组织缺乏一个有效的、便捷的、一站式的服务协同工具,IT可以快速上架服务,业务可以透明的获知服务反馈,管理上可以基于服务交付数据进行持续优化。
  • IT组织内团队如何保持激励机制,需要提供工作机制推动IT组织内由被动向主动转型,提升IT价值。
  • IT组织关键的价值链是什么?每条价值链路实际运营情况如何?如何持续提升?

  • 无标签

0 评论

你还没有登录。你所做的任何更改会将作者标记为匿名用户。 如果你已经拥有帐户,请登录