加入收藏 | 设为首页 | 会员中心 | 我要投稿 东莞站长网 (https://www.0769zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

中国移动王晓征:移动的运维实践之路

发布时间:2021-01-13 08:19:26 所属栏目:安全 来源:网络整理
导读:《中国移动王晓征:移动的运维实践之路》要点: 本文介绍了中国移动王晓征:移动的运维实践之路,希望对您有用。如果有疑问,可以联系我们。 作者简介: 王晓征 中国移动浙江公司 信息技术部副总经理 中国移动通信集团浙江有限公司信息技术部副总经理,中国移

上图我们的一个组织架构的转型.我们目前也成立了云计算中心,这个就是我刚才说的,我们把一个曾经的运维团队转型成一个架构的治理、建设、规划团队,这样我们的运维团队可以做到 40岁也没问题.

5.2 更透明的问题处理方式

传统运维在自动化、可视化、效率方面问题是比较多的,我们当时在传统的时候会发现,我们的应用租户始终觉得我们的平台不透明.

比如我们的租户在维护他的应用系统的时候,他会觉得是不是主机有问题、服务器有问题、数据库有问题,这种情况下我们很难说服他.

我们想办法做一个比较好的可视化工具,我们把自己的状态主动暴露给租户,这样可以极大提升租户运行的感知.

举个例子,我们在做维护的时候,特地增加了一部分的自动化的运维能力,其中比较好的两个能力,现在对核心数据库的异常操作是我们目前实现了自动化查杀,另外一块我们已经实现了通过手机 APP 对系统的灾备进行切换.

6、迈入新战场

上图是云平台规划的蓝图,详细不展开,我们的团队现在已经从一个系统的维护者转向一个系统的云平台的规划和建设者的角度去进行转型.

下图我们一个技术预研体系,我们现在在实际工作中,对于我们运营商的 IT 团队,有的时候也比较被动.

因为我们技术栈的引入很可能是由我们的开发团队去定的,但如果开发团队比较竖的话,会造成技术架构不标准,所以现在我们提出“预研一代、测试一代、推广一代”的工作策略.

下图是我们的一个重头戏,我们现在已经把我们的核心系统中的包括手机营业厅、CRM 前端全部跑在云上.

我们现在也已经把核心数据库全部都跑在了 X86 服务器上.应该说很多电信运营商目前都面临这样的挑战,希望能够在核心数据库服务器上进行去 IOE,这个我们浙江移动这边基本上也已经实现了.

7、抓实战促稳定

最后讲到实战的问题,刚才写到我们现在把容灾切换做到手机 APP 上,这个前提是我们的容灾切换必须是随时可以切换的.

我们有一个比较好的灾备的管理体系,在巅峰时期大概每年的灾备演练有300次左右,现在因为我们的技术架构发生了一些变化,目前没有这么多的演练次数.

我们最早的时候用的灾备技术是用存储复制技术为核心区区别做的,这种情况下数据中心处于冷备状态.

我们通过技术和管理的结合,要保证灾备切换的成功率至少要达到两个9以上,这种情况下再通过手机 APP 实现移动端的灾备切换.

我们最近一次在 APP 端的灾备切换大概花了8分钟左右.自己做灾备切换这么多年,我的感觉是,灾备切换本身是一个管理问题.

8、面对明天的困惑

现在我们心中也有一些思考和困惑,第一个是标准的问题,未来我们的团队会从运维转向平台,转向私有云的建设,在云的建设时候,我们应该怎么样面临不同的租户提供不同的服务级别.

我参考过国内很多互联网公司公有云上开放的服务标准,但是越看越困惑,因为免责条款太多了.

如果按照这样的免责条款,我们的团队 SLI 非常容易达到,但是面对私有云租户不能用这么低的 SLI,这是我们非常困惑的问题.

另外是价值,如何使IT产生价值,如何使我们的云平台产生价值,怎么让我的业务产生价值,因为有的时候我们做了很多技术创新.

但是这些技术创新到底怎么样让我们的业务部门认可,让我们的领导能够认可,这是一个比较大的困惑.

我们是运营商的传统企业,在传统企业的体制限制之内如何进一步发展我们团队的活力,这是一个非常大的挑战.

还一块是当下技术发展特别快,当年在 IOE 时代,其实我们的 IOE 时代也持续了差不多有10年之久,我们曾经花了这么长时间,在 IOE 时代把我们的团队做到了应该说在业界还是比较可以的.

(编辑:东莞站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!