本发明涉及云平台运维,具体涉及一种统一运维管理平台。
背景技术:
1、云平台是一种基于硬件资源和软件资源的云计算平台,可以提供计算、网络和存储能力的服务平台,资源池化的手段,避免重复的软硬件投入,提高资源利用率,降低运维系统管理复杂度,提高运行效率。
2、传统的云平台运维服务管理以云管平台为主要工具手段,对各种资源进行统一管理,包括基础物理设备资源、虚拟化资源、网络资源、存储资源等,通过对这些资源进行统一建模和资源池化,以提供给系统用户即上层应用;提供自动化运维,包括物理服务器、虚拟机、操作系统和应用软件的自动化部署和管理;实现应用弹性伸缩,即根据应用的需求自动调整应用运行所需的资源;对虚拟化主机、虚机、网络和存储计算资源进行全面监控,及时发现it系统的运行故障。
3、传统的云平台运维基于云管平台能力,专注于云平台资源的运维服务提供及保障,缺少用户需求、事件响应处理能力,缺少智能化、自动化的客户服务能力。由于云平台中的虚拟机数量庞大,而且经常需要进行配置变更,配置管理困难,如果配置不正确或不一致,可能会导致系统出现故障或性能问题;由于云平台中的资源是共享的,因此资源分配不合理可能会导致资源浪费或性能瓶颈,没有正确的管理和监控措施,可能会导致资源分配不均和性能问题,同时没有数据分析能力无法进行趋势的研判,很容易造成资源紧缺,需求无法满足;云平台中的虚拟机数量庞大,而且经常需要进行配置变更,基础物理因此监控和日志管理的难度也非常大,没有监控和日志管理措施,可能会导致无法及时发现和解决系统故障和性能问题;云平台的操作相对于传统的it系统来说更为复杂,需要专业的运维人员来进行操作和管理。同时,传统的运维由于云平台的运维与实际用户需求、事件响应相互独立,信息的不共享导致管理和维护的难度增加。
技术实现思路
1、针对现有技术中的缺陷,本发明提供一种统一运维管理平台,以解决目前对云平台的运维管理中,由于设备资源数量多,在缺乏有效监控和运维的情况下容易导致资源分配不均和性能降低的问题。
2、本发明提供的一种统一运维管理平台,用于为业务云平台提供统一云资源管理和运维服务支撑,所述统一运维管理平台包括:
3、云管系统,用于实现物理资源、中间件和数据库服务的集成管理;
4、运维系统,用于为用户提供交互入口及需求服务;
5、监控系统,用于对硬件资源、软件和外部环境进行监控和预警;
6、所述云管系统、所述运维系统和所述监控系统融合,实现数据传递共享。
7、由上述技术方案可知,本发明提供的统一运维管理平台,通过云管系统、运维系统和监控系统三个系统融合,实现高效的用户需求响应以及系统资源的全生命周期管理。
8、可选地,所述云管系统包括:
9、资源管理模块,用于对资源统一组建管控资源池,实现资源管理;
10、资源分配模块,用于对所述资源管理模块已纳管的资源进行按需分配;
11、资源计费模块,用于对所述资源分配模块分配的资源提供计量和定价;所述资源计费模块根据预配置的管理信息数据库,对所述资源分配模块分配的资源及所述运维系统提供的服务需求不同的用户提供针对性计费服务,所述管理信息数据库通过相同组织不同用户的资源数据、资源用量数据、服务请求数据、故障处理数据、技术支持数据、终端维修数据、设备维保数据进行ai模型训练获得。
12、可选地,所述管控资源池包括服务器虚拟化资源池和桌面虚拟化资源池,用于为业务系统提供iaas服务。
13、可选地,所述运维系统包括客户服务单元、事件处理单元、运维数据分析单元和运维支撑单元。
14、可选地,所述客户服务单元包括:
15、智能呼叫中心模块,用于提供前端语音多媒体统一排队;
16、智能ai客服模块,用于智能处理客户资源和问题;
17、客户自助服务模块,用于依托所述智能呼叫中心模块和所述智能ai客服模块,自助提供服务;
18、所述智能呼叫中心模块对输入的语音或信息识别或自主判断用户需求字段,通过与知识库的信息字段进行比对,查询到与用户需求字段关联的信息字段,所述信息字段的关联解决方法反馈给所述智能ai客服模块用于回复用户;
19、所述运维系统根据所述信息字段及关联解决方法同步生成数据工单,由运维人员获得进行解决,运维人员的操作记录存储于所述运维系统的数据表单中与所述云管系统和所述监控系统同步存储。
20、可选地,所述事件处理单元包括:
21、事件响应模块,用于基于服务目录的请求支持,为用户提供请求的服务;
22、故障处理模块,用于实现itil的事件流程管理,处理监控告警事件。
23、可选地,所述运维数据分析单元包括:
24、运维大数据模块,用于通过大数据分析提供用户导向性服务;
25、数据运营中心模块,用于面向用户所属企业提供数据资产治理以及自助式开发数据服务。
26、可选地,所述运维支撑单元包括:
27、it资产管理模块,用于实现it资产的管理;
28、配置管理模块,用于提供配置管理数据库;
29、密码库模块,用于实现对所有资源的密码信息的统一管理;
30、服务拨测模块,用于获取网站和服务的运行状况;
31、运维服务共享模块,用于实现对api服务的全生命周期管理。
32、可选地,所述监控系统包括:
33、环境监控单元,用于实现机房可视化;
34、网络监控单元,用于主动发现网络设备,用于提供全网拓扑视图和自定义拓扑视图,分析业务的流量使用情况;
35、设备监控单元,用于监控硬件故障信息和硬件状态信息;
36、应用监控单元,用于采集、统计和分析来自业务系统的报警信息和故障信息;
37、可选地,所述环境监控单元、所述网络监控单元、所述设备监控单元和所述应用监控单元均部署有基础服务层、数据采集层、业务处理层和页面展示层,
38、所述基础服务层用于实现相应资源池的监控;
39、所述数据采集层用于数据集中采集,并基于kafka集群将数据发送至所述业务处理层;
40、所述业务处理层基于grafana对数据进行可视化处理,并结合elasticsearch集群对数据实现存储分析;
41、所述页面展示层用于可视化展示。
42、采用上述技术方案,本申请具有如下有益效果:
43、本发明通过云管系统、运维系统和监控系统三个系统配合,能够提高资源利用、系统可用性和稳定性,实现高效的用户需求响应和系统资源的全生命周期管理。降低运维人员工作量,有效提高运维工作效率,保证高效运行。
1.一种统一运维管理平台,其特征在于,用于为业务云平台提供统一云资源管理和运维服务支撑,所述统一运维管理平台包括:
2.根据权利要求1所述的统一运维管理平台,其特征在于,所述云管系统包括资源管理单元,所述资源管理单元包括:
3.根据权利要求2所述的统一运维管理平台,其特征在于,所述管控资源池包括服务器虚拟化资源池和桌面虚拟化资源池,用于为业务系统提供iaas服务。
4.根据权利要求3所述的统一运维管理平台,其特征在于,所述运维系统包括客户服务单元、事件处理单元、运维数据分析单元和运维支撑单元。
5.根据权利要求4所述的统一运维管理平台,其特征在于,所述客户服务单元包括:
6.根据权利要求4所述的统一运维管理平台,其特征在于,所述事件处理单元包括:
7.根据权利要求4所述的统一运维管理平台,其特征在于,所述运维数据分析单元包括:
8.根据权利要求4所述的统一运维管理平台,其特征在于,所述运维支撑单元包括:
9.根据权利要求1所述的统一运维管理平台,其特征在于,所述监控系统包括:
10.根据权利要求9所述的统一运维管理平台,其特征在于,所述环境监控单元、所述网络监控单元、所述设备监控单元和所述应用监控单元均部署有基础服务层、数据采集层、业务处理层和页面展示层,