加入收藏 | 设为首页 | 会员中心 | 我要投稿 东莞站长网 (https://www.0769zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

谈自动化运维平台的地基如何打牢

发布时间:2021-01-20 22:31:12 所属栏目:安全 来源:网络整理
导读:《谈自动化运维平台的地基如何打牢》要点: 本文介绍了谈自动化运维平台的地基如何打牢,希望对您有用。如果有疑问,可以联系我们。 作者介绍 战学超,青航数据架构师.曾任职于NEC软件、海尔B2B平台巨商汇,负责企业数据平台构建、B2B电商平台数据管理与搭建.
副标题[/!--empirenews.page--]

《谈自动化运维平台的地基如何打牢》要点:
本文介绍了谈自动化运维平台的地基如何打牢,希望对您有用。如果有疑问,可以联系我们。

作者介绍

战学超,青航数据架构师.曾任职于NEC软件、海尔B2B平台巨商汇,负责企业数据平台构建、B2B电商平台数据管理与搭建.拥有丰富DBA、系统运维架构经验,擅长数据库、数据平台搭建、私有云部署、自动化运维等.

万丈高楼平地起,高楼稳不稳取决于地基是否扎实.基础数据便是运维管理这座高楼的地基.

首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些.请看下图:

基础数据大致分为CMDB、日志、生产DB、知识库四个模块.

一、基础数据概况

CMDB中文是配置管理数据库,存储与管理企业IT架构中设备的各种配置信息,与未来的IT运维管理标准化和流程化紧密关联,并且支持流程的运转.运维管理平台创建初期或初版中的CMDB更多是偏向IT资产管理,我们在这里定义的IT资产管理,暂时抛除公司个人使用的普通PC机.

日志主要存储CMDB中涉及到服务器或是其它设备的日志信息.

DB主要是所有IT系统的数据库信息,包括运维管理系统本身的数据库.由于数据库的重要性,所以在基础数据中单独一个模块管理数据库,包括生产数据库、测试数据库、开发数据库.数据库的日志放在日志模块进行统一管理,监控和备份.

知识库主要存储日常运维管理中发生的事件、问题以及一些经典问题的解决和常用的解决方案,主要起到运维管理辅助的功能.

二、基础数据三要素

基础数据要求完整、准确、实时,这三个特性缺一不可.

1.完整性

完整性,要求在数据采集整理阶段,要一一梳理,不能有遗漏.任何一个设备的疏漏都将会导致未来出现问题.例如最近的勒索病毒在防范上需要给服务器升级打补丁,这个时候就是根据服务器清单一一对照,升级.如果有遗漏落下的服务器未及时打补丁而导致病毒入侵,后果将很严重.那么,如何做到完整性呢?大致可以分为以下几步:

首先数据采集阶段多人(推荐三人以上)同时对IT资产进行采集,那么在数据采集完成后,将会有三份或以上的IT资产清单.

接下来就是相互确认阶段.相互check对比两方的清单和自己梳理的清单,找到不一样的地方,大家在一起开会进行讨论.经过这个阶段,会产生一份相对完整且三方(或以上)认可的IT资产清单.

最后就是三方(或以上)一同针对认可的IT资产清单进行最终check,确保最后的清单,是经过多方讨论确认,并最终又check过的IT资产清单.此时这份IT资产清单,相对比较完整.另外在梳理、讨论和check的过程中,针对新增、变更、删除的IT资产一定要及时更新我们的IT资产清单.

2.准确性

准确性要求IT资产清单或是CMDB中存储的数据不能与实际情况有任何差异.要做到基础数据的准确性除了在数据采集阶段要下功夫外,要在运维管理的每一个阶段定期对基础数据进行审计,确保基础数据中的数据无误.一般月度一小审,半年一大审,具体情况根据企业的IT规模而定.

3.实时性

基础数据的实时性可以确保数据的准确性.即基础数据的每一次变动,包括增加、删除、修改,不论大小,只要有变动(在运维流程完结阶段,执行运维操作成功后,就要及时更新基础数据.忽略基础数据的实时性,必将导致准确性大打折扣,在以后的月审、年审中必将导致额外的工作量.一般在审计的过程中,当数据的错误率达到一定程度后,需要重新梳理全部数据,以确保最终的准确和完整.

CMDB

CMDB总的来说分为:产品线、资产管理、供应商管理三个部分.总的思路是:通过产品线管理IT资产,通过IT资产信息管理硬件或服务提供者,供应商管理.

1.产品线

产品线是指整个公司所有IT系统、产品按照属性进行归类划分.这有一个前提,就是梳理整个公司的IT项目和IT服务.这里项目也可以理解为每一套IT系统,例如OA、CRM、订单系统、支付系统等等.

IT服务主要是指:应用服务(Tomcat、WebLogic、数据库服务等),基础IT服务如Nginx、Varnish、Redis等.通过项目和服务两个维度来管理IT资产,尤其是虚拟机.因为一般系统和服务都是部署在虚拟机上,虚拟机的宿主机则是一台台物理主机.

产品线的划分一般除了根据业务分类划分几个大的产品线外,还需要划分一些基础产品线,如:信息安全产品线,主要管理信息安全、网络安全等系统和设备等;基础服务产品线,如Nginx反向代理大部分系统,Varnish缓存Web静态资源等.

在这里单独说一下产品线和项目包括的服务必须制定运维优先级等级.运维等级的制定不能简单定义为多少级,而应该是为每一套系统进行运维优先级打分,分值不能一样.这样保证在大面积故障的时候,可以根据优先级解决问题.

2.资产管理

资产管理主要有以下几个方面.首先是比较大的机房管理.有的企业可能会有多个机房,每个机房的基础信息,如带宽、位置、值班电话等都需要加以整理存储用来管理机房信息.机房中的机架、机柜、交换机、路由器等硬件信息,机房的空调、UPS电源、环境监测系统等都属于机房管理的范畴.

安全设备管理.安全设备管理这里主要包含防火墙、IPS、WAF、VPN等网络设施.企业信息安全非常重要,在运维管理中也把安全作为一个单独的模块进行管理.通过购买安全硬件设备和安全服务,不断学习和研究,从而保护好企业数据信息.

服务器管理.这里假定企业实现了虚拟化,大部分系统和服务都部署在虚拟机,而虚拟机是部署在物理机上.服务器管理分物理机和虚拟机分开管理,同时又密切关联.虚拟机在哪一台或几台物理机需记录清楚.

根据产品线中定义的运维优先度等级,在资产管理中的每一个节点标注上相应的等级分值,以便出现大规模故障,有选择、有重点、有顺序地逐一解决问题.

3.供应商管理

供应商管理主要是管理由第三方企业提供的IT系统或设备的服务信息.记录供应商的具体信息、值班电话、硬件备件库等信息.

(编辑:东莞站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!