网络运维管理系统目标有哪些

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了网络运维管理系统目标有哪些相关的知识,希望对你有一定的参考价值。

当前,我们需要认识的是自己究竟需要一个什么样的网络运维管理系统目标。当IT成为企业业务发展和管理不可或缺的组成部分,并在提供收益的同时又带来风险时,就需要对IT的管理有新的认识。当前,国内企业IT信息化正在经历从关注技术到关注业务的转变,高额投入的信息化如何服务于企业核心业务,提升企业运营效益,成为管理者关注的新焦点。一个良好的IT综合管理系统可以有效地监控操作系统环境、网络环境、数据存储环境、信息安全环境和业务应用环境,可以准确地定位和综合诊断系统异常的原因并提出修复的方案,可以有力地为业务系统保驾护航,让业务应用高枕无忧,从而使企业IT部门可以将更多精力投入在如何推动业务发展,实现IT投资的最终目的。另外一方面,由于国内的IT管理整体水平参差不齐,参加管理的角色多样,这也决定了一个良好的IT综合管理系统可以满足不同角色和不同视角对管理的需要。不同管理角色考虑不同的网络运维管理系统目标在一个企业中,不同角色的IT管理者,对IT环境的维护有着不同的需求:对维护者——值班运维人员而言,他需要一个简单易懂的巡检监控类平台,通过平台提供的各种信息帮助他快速简单的了解一些基本信息,包括网络、主机、服务、告警。值班人员主要看的是总览类型的数据。对网管员而言,他需要一个综合的平台,通过平台提供的各种工具帮助他了解并管理异构环境中发生的各种事件:网络拥塞、设备故障、服务器的利用情况、应用的可用性、网络中的流量异常情况等等;要拥护各种工具来定位问题和解决问题。对信息部门负责人——信息主管而言,他需要保证运行维护的规范性以减少意外的发生,同时需要掌握各种资源(网络设备、网络带宽、服务器、各种终端)的利用情况,为设备的优化和扩容提供强有力的依据。对于企业管理者——对于企业的最高管理者而言,他需要了解对IT信息化投资的回报情况,希望了解自己的下属通过网络做了些什么,对工作及业务产生了多大的效益。一个真正综合而全面的IT运行维护系统,才是用户的最终选择。这个系统应该兼顾多方面的需求,在一个统一的平台上,实现对异构的IT环境的运行、维护的规范化,对IT信息化的使用效果进行综合管理和分析。因此,必须从用户角度出发,对网络业务/服务,及其背后的IT基础架构(路由器、交换机、服务器等)进行全面透明的监控。用户都希望IT部门能提供保障业务的服务质量,不仅能在服务可用性、响应时间等方面提供确切的服务保证,还能在服务中断或停顿时,及时发出通知并解决问题。网络运维管理系统目标IT运维管理系统应该优先为用户提供保障业务系统稳定运行的解决方案。通过对整个业务系统的关注,保障业务系统正常运行。提供分阶段、分步骤、实用易用的IT管理系统,保证处在不同IT管理阶段的客户实现预期目标。有哪些具体的网络运维管理系统目标?提供明确的管理思路在网络环境日渐复杂的今天,我们的实际网络管理工作中需要对IT资源进行管理,以保证业务系统的正常运行。传统的头痛医头,脚痛医脚,这不是解决问题的根本办法,要从根本上解决管理的问题,必须从管理思路着手,只有这样,我们才可以对管理有清晰的认识,才能实现真正意义上的管理。这个管理思路应该贯穿始终,主动告诉我们应该关注什么内容,指导我们如何去进行管理,问题出在哪里,该从什么角度入手分析,主动定位问题的位置等。因此,我们需要运维管理系统提供明确的管理思路。提供直观的管理呈现方式无论在哪个企业,在对底层物理网络的结构和瓶颈的信息获取方面还没有更有效手段。传统意义上的数据分析和逻辑显示图的方式,已经远远不能满足当今运维管理的要求。直观的呈现方式无论是作为了解信息的方式,或者是发现问题的手段,都是最为直观的。为了更加有效的做到对现有网络的架构和健康状况分析和了解,直观的呈现方式必不可少。提供综合的一体化管理平台一直以来,企业的管理模式处于被动分散的维护状态,各个管理系统之间相对独立,底层数据无法共享。运维管理系统必须将这种现状转变为主动集中的控制和管理,避免操作时在多个系统之间来回切换,并将来自IT环境的管理数据最终映射为依赖这些资源的业务及职能的可用性和健康性,这是网络运维管理系统目标之重。提供多种发现问题和准确定位的管理机制作为成熟的运维管理系统,不仅需要提供直观的网络、应用和业务等视图。而且需要提供多种发现问题的机制,可以做到多渠道去分析和发现问题,并主动告警。实际工作中,网络中的各种问题总是会不期而至,通过运维系统提供的多种发现问题机制,可以做到及时的发现。当然,更为重要的是,发生问题以后,要能做到准确的定位,这样大大节省时间,提高工作效率。保障业务系统的稳定运行运维管理系统需要从业务角度切入,以业务为导向,通过对整个业务系统的关注,落实业务系统的各个环节,从而来达到保障业务系统稳定运行和透明化管理的网络运维管理系统目标。 参考技术A 智能网络管理系统分析与系统设计
4.1需求分析
随着网络技术的不断发展,5G时代的来临,网络设备数量的迅增导致网络管理难度的增大,系统管理人员的工作压力繁重,特别是目前大量的基于Web环境的各个业务系统对企业的网络提出了更高的要求,除了要保证网络的安全性、稳定性、保密性、可靠性外,还要确保网络速度、服务质量、使用方便等各个因素。网络管理系统面临网络设备运行环境是否安全、设备运行是否平稳、设备故障能否快速发现并解决等问题。本文采用B/S架构可以更大程度上跨平台使用此系统,结合web技术和人工智能技术根据实际情况实现具有故障诊断的智能网络管理系统,在一定程度上实现传统网络管理系统的自动化。图4.1为系统模块用例图:

4.1.1功能需求
(1)从用例图中可以看到,本系统分为两种角色,超级管理员和普通用户。超级管理员拥有最高权限,可以对普通用户进行添加、修改、删除操作,用户管理本质就是通过赋予用户角色对系统操作权限不同,使得用户角色分工不同更加网络管理工作更加细致和明确。同时,超级管理员可以升级普通用户为超级管理员也可以根据人员不同赋予不同的权限。(2)用户可以在系统中添加和删除网络设备,在实际企业当中网络设备资源数量众多,针对设备资源进行有针对性行的管理可以满足企业日益增加的设备需求。用户可以通过在系统中填写设备详情添加相应网络设备;选取相应设备填写对应标签、地址、流量类型可以掌握设备端口流量流入流出情况和连接状态以及查看设备信息;选取某设备端口,输入修改后的ip地址、子网掩码、登录密码、特权密码等可以通过telnet协议对设备端口进行配置;如果某设备已经损坏或者不再需要时,可以点击删除按钮对设备进行删除;可以查看个人详细信息对个人信息进行修改。(3)网络故障是是网络管理系统中的重要模块,网络可以平稳运行是评价网络管理系统的重要指标。网络虚拟环境下,复杂的资源关系以及各资源之间的互相干扰,一旦某个接口发生故障,故障数据隐藏在底层网络可能会蔓延到整个网络,导致整个网络无法运行,这样无疑给网络恢复带来了更大困难,增加了企业成本。本系统故障模块针对以太网中的接口故障,在现有智能故障诊断技术中,BP神经网络具有良好的非线性能力和自学习和自适应能力,因此,本系统故障模块引入BP神经网络,采集接口故障数据经过BP神经网络训练可以实现对目标接口进行故障诊断,并判断故障类型。同时用户可以查看历史告警记录表对故障信息进行统计。
4.1.2非功能性需求
系统应具有实用性,能够满足实际业务需求,各个功能模块业务可以高效正确的运转。要求设计简单、架构和层次设计清晰,便于维护和扩展具有一定的可靠性和易用性。系统安全是网络管理系统的必要条件之一,防止sql注入等安全问题出现,对前后端数据传输进行验证防止前端传输不安全数据到后台服务器当中。在监控模块中系统可以对设备数据进行实时监控并展示,应具有实时性。
4.2系统总体架构设计
本文研究利用Django、Vue等开发技术,并结合人工智能网络故障智能诊断技术设计并实现了智能网络网络管理系统。系统总体架构分为视图层、应用服务层和设备层三层。系统的设计总体架构如图所示:
1)视图层使用前端相关技术如Vue, ECharts开发系统界面包括界面的布局与美化、用户交互设计等。
2)应用服务器层包括Web服务器和NMS两部分。Web服务器可以处理浏览器的请求并返回相应。在此系统中接收前端传来的数据请求,经过后台程序解析处理完成对应操作。NMS是网络管理工程当中的核心,通过代理向设备发送指令,管理被管设备,可以通过oid查询MIB库保存对应项获取目标设备网络数据。
3)在网络设备层,被管设备代理是网络上被管设备代理的集合,主要工作是采集数据和分析数据。系统首先服务层通过Telnet协议连接网络设备,通过SNMP协议实现对网络设备运行状态的监控,将采集到的数据进行计算处理之后存储到mysql数据库中。
4)Mysql数据库是系统开发功能模块的基础,用于存储用户数据、网络运行数据以及故障数据等。用户通过对数据库进行新增、查询、更新、删除操作对系统数据进行管理。
4.3系统主要功能模块设计
本系统分为用户管理、配置管理、设备监控管理、故障诊断四个功能模块,下面将对这四个模块的设计进行详细说明。
4.3.1系统功能模块
1)用户管理:系统管理员使用该模块可以完成查看、添加、修改和删除系统全体用户账号的管理操作以及用户登录功能,该模块的设计类似于RBAC(基于角色的访问控制),不同的管理员拥有不同的系统操作权限。
2)配置管理:通过web界面对设备进行相关配置即命令下发,管理员可以通过该模块远程连接目标设备并且对设备端口进行ip和子网掩码修改以及置。
3)设备监控管理:对通讯设备接口进行实时流量监控,返回数据便于管理员及时查看设备运行状态查看资源并且统计流量数据。
4)故障诊断:及时发现通讯网络接口中发生的故障,并判断故障类型便于管理员及时处理故障,以免造成更大损失。
4.3.2用户管理模块设计
用户管理模块是管理系统中较基础同时也是非常重要的一个模块,主要负责对该系统用户进行统一有效管控,用户管理模块活动图如图4.4所示:
1)用户登录:系统部署在服务器之后,Django框架可以使用命令创建一个超级管理员。超级管理员和普通用户可以通过用户名和密码登录到该系统当中。
2)用户添加:超级管理员拥有该系统的最高权限,可以添加普通用户无需注册,添加信息主要包括,用户名、密码、头像、邮箱等信息,普通用户可以根据超级管理员分配的权限参与管理系统。
3)用户删除:超级管理员界面可以删除当前普通用户角色,删除之后原普通用户用户名好密码作废。
4)用户信息修改:超级管理员和普通用户都可以对自己信息进行修改包括密码、个人资料,超级管理员可以赋予普通用户权限等。
4.3.3配置管理模块设计
网络设备配置模块主要用于对设备参数进行设置和修改和对设备进行添加和删除,从而对设备进行管理。该系统主要针对设备端口ip地址和子网掩码进行修改,配置管理结构示意图如下:
1)设备参数配置:首先在被管设备开启端口并配置Telnet协议,同时设置登录名和登录密码以及特权密码,用户在浏览器通过表单填写相关目标设备信息,通过HTTP协议传输给服务器,服务将前端传过来的信息解析成设备可以识别的指令,代替管理员在终端直接对设备的操作,自动下发对应指令到设备上完成配置。
2)设备添加:用户可以添加某个设备,并给予相应标识,网络设备列表当中就会出现当前所有设备,设备信息也会存储在数据库当中。
3)设备删除:当某一项设备不再使用管理员可以在浏览器的设备列表当中将其删除。
4.3.4设备监控模块
设备监控模块主要监控设备运行状态以及资源消耗情况,存储到Mysql数据库当中,通过前端组件以图表的格式将其可视化,可以让管理员更加直观的观测到网络设备的运行状态。设备监控模块结构示意图如下:展示设备是否在线,以及展示当前运行设备列表,通过SNMP协议可以判断目标设备是否在线,如果在线前端提示目标设备当前正在运行,否在提示当前设备不在运行或者未正确安装SNMP协议,因为监控模块主要通过SNMP协议访问设备获取MIB变量得到目标值并测试其连通性。
1)实时展示目标设备端口流量流入和流出情况,管理员在前端添加监控目标,通过SNMP协议和目标设备通信,如果当前设备在线也就是服务器可以通过SNMP和目标设备通信,服务器查询目标设备的MIB对象,找到请求的数据,将返回的网络数据存入数据库,前端利用Echarts进行绘图,为了更加直观,流量图采用曲线图的方式展示时间段内某端口流入或者流出网络总流量,单位按照每秒总传输量来计算。此外,管理员可以切换目标设备查看。
4.3.5故障诊断模块
故障诊断模块就是协助管理员及时发现并处理网络设备突发的故障,本模块引入了BP神经网络故障诊断技术,目的是高效快速的判断网络设备接口故障类型。基于BP神经网络的网络故障诊断流程示意图如图4.6所示:
故障发现及时与否对网络设备能否持续提供服务至关重要。通过SNMP协议主动轮询和异步警告可以获取到设备发生的故障信息,服务器获取到网络状态故障信息后,经过分析,如果可以直接判断故障类型,则直接发送到前端界面,这类故障类型一般具有较明显的特征。如果某接口发生故障不可以直接判断其故障类型则通过基于BP神经网络的故障诊断模型进行判断,将获取到的接口相关数据自动进行预处理后作为故障诊断模型的输入数据,故障诊断模型会输出相应结果对应相应故障可视化到前端提示管理员,管理员可以通过前端查看故障信息进行修复。4.4数据库设计
4.4.1系统E-R图
系统数据库包含多个实体,实体之间具体包含一对多和对多对的关系。系统E-R图如图4.8所示:

4.4.2数据库表结构设计
根据需求分析的结果数据库表设计如下:
(1)用户表用于记录用户相关信息,其中用户ID(userId)作为用户表的主键自增。
(1)设备监控表,存储监控的目标设备信息。
4.5 本章小结
本章节主要内容:首先对基于用例图进行系统需求分析,对系统整体总结构进行了设计,其次根据需求设计了系统整体功能模块图,接着针对各个功能模块结合活动图进行详述,最后对整个系统的数据库表设计进行了简要概述。

做运维需要掌握哪些技能

运维以技术为基础,通过技术保障产品提供更高质量的服务。运维工作的职责及在业务中的位置决定了运维工程师需要具备更加广博的知识和深入的技术能力:

扎实的计算机基础知识,包括计算机系统架构,操作系统,网络技术等;

通用应用方面需要了解操作系统、网络、安全,存储,CDN,DB等,知道其相关原理;编程能力,小到运维工具的开发大到大型运维系统/平台的开发都需要有良好的编程能力;数据分析能力:能够整理、分析系统运行的各项数据,从中发现问题及找到解决方向;丰富的系统知识,包括系统工具、典型系统架构、常见的平台选型等;综合利用工具和平台的能力;

运维工作的复杂性对这个岗位的运维工程师们的软素质也提出了要求:

时间管理能力,特别是碎片化时间的处理能力;沉稳的心态,面对紧急情况时需要处变不惊;沟通能力、团队协作,运维工作跨部门、跨工种工作很多,需善于沟通、并且团队协作能力要强;工作中需胆大心细:胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;心细,运维工程师是最高线上权限者,需要谨慎心细;主动性、执行力,能够主动学习国际国内的运维技术,并引入到工作中,提高运维的质量和效率;

运维工作中需要掌握哪些技术呢?:

    一共四大方面:1、排错;2、优化;3、数据库;4、开发语言,但是第5必须的,就是运维意识,相当重要。

 

第1点和第2点都需要经验去支持,这个没经验你根本不知道排错和优化是怎么搞,在学校和培训机构各种吹虚里,根本就不可能掌握到,这不是说你安装什么软件时遇到错误能解决那些,那种虽然也叫排错,但只是基础级别,真正的排错是指平台出故障,让你去分析与处理,而出现的错误会各式各样,而且涉及的范围也很广,所以这个是需要经验去支持的。

 

第2点优化更是个大问题,基本没经验是弄不了,别以为培训机构会教1-2天优化课程就掌握了这技术,这是不可能的,优化可以说是运维最吃香的技能,但也是最高难度的,因为涉及的知识面很广而且还需要很深入了解,优化是有风险,不是随便在网上搜个文章对着改一下配置文件参数或系统参数就优化了,这是乱来有风险的,甚至怎么样才算有效优化,我也不想说,因为对于没入行的人来说是很难去理解。

 

第3点数据库,也是运维加工资的重要核心技能,有些公司的运维可能接触不到数据库,其实运维的加工资技能要么就是开发,要么就是数据库,如果这2点都不会,那么就是个比网管高级点的打杂罢了,相对于数据库来说,运维的操作还是会有的,而且还昔昔相关,一但操作失误又无法回滚,那就尴尬了。

 

第4点开发语言,就是上面所说的,要懂PYTHON或PHP,至于学这个干麻,这个我也不好说,要解释又一大段话,只能说现在都存在这个需求,特别是python,你会发现公司招聘时有这个需求,但真正工作时又不需要用,其实不是这个意思,python是自己想用就用,而不是公司要求你用,例如你去完成一个很麻烦的操作,而shell可能无法满足你或者效率很低,那么你就需要用python去满足,这是自己需求使用的,跟公司无关,但就能体现出你的价值了。

 

而第5点是每个运维都必须的,意识是很重要,并不是你技术很牛,学的技术很多很熟,就不代表你不需要运维意识,其实领导很看重运维意识的,例如有没有做好备份,权限分配问题,平台测试情况,故障响应时间等,这些都是意识,而不是你学了很多技术自认大牛了,平台发现故障你又没什么大不子,以为很简单的问题喜欢处理就处理,不需要向其它部门反馈等,领导不是看你的技术如何,而是看你的运维意识如何,你没运维意识,技术再牛也没用,只会让其它部门的人跟你不协调。

以上是关于网络运维管理系统目标有哪些的主要内容,如果未能解决你的问题,请参考以下文章

运维工程师必须掌握的基础技能都有哪些?

IT运维可视化都有哪些作用?

云时代的IT运维面临将会有哪些变化

运维需要学啥

做运维需要掌握哪些技能

运维工程师必须掌握的基础技能都有哪些?