加入收藏 | 设为首页 | 会员中心 | 我要投稿 东莞站长网 (https://www.0769zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 资本 > 正文

【IDCC2019】腾讯栗权:腾讯智维平台与数据中心运营体系结合

发布时间:2019-12-23 12:53:49 所属栏目:资本 来源:中国IDC圈
导读:副标题#e# 大数据时代,数据呈现爆炸式的增长,全球掀起了兴建数据中心的热潮。在新时代,未来数据中心如何建设运营,又将呈现出怎样的发展趋势?2019年12月19日,第十四届中国IDC产业年度大典(IDCC2019)第二日精彩继续,行业专家和企业代表云集IDC建设与

大家可以理解为影响因子排序在前的就是对机房PUE贡献比较大的。基于对这些影响因子的分析,我们又引入了一个灵敏度分析的算法,给出来一个通过AI计算而输出的推荐值意见。平台告诉我们基于当前的供水温度和送风温度,在保证我们所输入的安全边界不被打破的情况下,你可以有多少的优化空间,以及优化到什么程度的时候PUE值会降低多少。这个项目出于谨慎起见,对于系统给出的每一个优化建议我们都有一个严格的变更流程进行控制,变更完之后,我们要根据实测值与系统的推荐值进行比较,因为要剔除掉很多干扰因素,所以我现在没有办法直接告诉大家通过AI算法我们的PUE到底降低了多少,但是PUE能够在一定空间内通过AI算法安全地调优,这个方向已经被我们的实验认证了。

分析完DCIM之后,再给大家介绍一下智维平台在DCOM这个模块里的设计理念。DCOM是指我们日常运营过程中的流程以及流程之间的关联关系。我们在搭建DCOM的时候,有一个基本的理念,海恩法则。任何一起数据中心的事故,比如导致我的服务受到影响,导致宕机或供冷中断的事故,背后都有很多潜在隐患和未遂的风险存在。所以,只要我们在日常运营过程中,在事前尽量多地将隐患消除掉,让隐患不成立,一定程度上就可以保证末端服务的连续和稳定。这是我们DCOM搭建的一个核心理念。由于数据中心运营行业使用的已经比较成熟了,所以我这里重点提一下腾讯正在使用的智能化巡检模块。

智能化巡检模块基于一个理念,我们把现场每一台设备,或者我们所管理的每一台设备都以结构化的方式把它的巡检相、巡检标准和设备编号进行结构化的处理或者转译。现场借助于RFID扫码的形式激活每一台待巡检设备,以此获得巡检项,这样天然提升了巡检效率,而且也能保证巡检质量,也能够降低执行巡检人员能力门槛。

在这个理念之上,腾讯在2019年下半年又对巡检工作做了升级。我们认为巡检只是对监控系统的不足以及监控系统无法覆盖的设备进行人工确认,对于监控系统已经能够实现远程监管的设备,我们已经从巡检系统中剥离了。所以,我们经历了对于现场巡检由繁到简又从繁化简的过程。

关于智维平台的DCSM管理。腾讯云业务形态有很多种,其中一个重要的是托管用户比如58同城,他对我们腾讯机房的机架进行整机架租赁,机架上托管着他们自己的服务器。像58这种用户,他对他所享受的服务更关注的是当前的温湿度,环境怎么样,我的设备分布在你的机房里哪个位置,我还有多少空间或者多少的容量能够继续使用。基于这个需求,DCSM就重点解决了用户关注的综合视图以及资源查看、运营过程透明化的挑战。托管用户可以在平台里看到他所有所使用或所托管设备的运营情况,并且可以通过平台看到每一台设备的资源信息,发起所有服务目录中我们已经跟他签约的每一个服务项,确保所有的需求能够被线上记录,精准的传递到我们的现场。这样将运营过程中的风险控制到最低。

腾讯智维本身源于腾讯自己的一个运营平台,从2014年至今这套平台已经推广到了腾讯的四大片区,包括我们所有的自建机房以及合建租赁机房。截止到目前,这一套运维平台已经覆盖了腾讯全部10万个机架以及100万服务器所在的数据中心的基础设施运营管理。如果大家对腾讯智维平台更详细的功能和特点有兴趣,可以跟我继续联系,咱们再进一步沟通。

我今天的分享结束,谢谢大家!

(编辑:东莞站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读