本发明属于电力技术领域,涉及一种缩短远动通道故障定位时间的方法。
背景技术:
电力系统的调度机构一般有县调、地调、省调、网调、国调五级调度机构。湖北省电力公司实施大运行体系后,荆门地区调度技术支撑系统实现地县一体化运行,地调自动化专业的运维范围除地调调度管辖外扩大到县调及其35kv及以上变电站。目前,各县调调控中心无自动化专职运维人员,相应调度技术支撑系统由地调自动化班提供延伸维护,自动化专业的技术支撑作用更加重要。远动通道作为连接主站系统与变电站设备的传输通道,传送实时及非实时业务,为厂站信息传送至调控中心重要中枢节点,在整个大运行体系下起着关键作用。
2014年,荆门地区实现调度数据网全覆盖后,自动化系统的数据通道传输方式发生了根本改变,所有厂站信息均实现了网络直采,与主站采用iec60870-5-104通讯规约进行数据交互。厂站端实时数据经远动通道上送调度主站,经历了3个专业的运维界面,分别是二次检修专业、通信专业、调度自动化专业。远动通道的基本结构如图1所示。
远动通道上任何环节故障均会造成远动通道故障,影响变电站信息数据上传。变电站远动通道故障后,调控人员将失去对该变电站的监控,产生最直接的后果主要有3方面:(1)调控人员无法监视通道中断厂站所有设备相关信息包括控制母线电压,影响供电电压质量;(2)厂站事故跳闸时监控人员无法及时获知事故信息,容易造成事故扩大或增加停电时间;(3)通道中断时间过长,要恢复有人值班、增加运维人员工作强度。
远动通道故障时,调控中心的自动化人员应尽快判断远动通道的故障类型和范围,为远动通道相关运维专业处理故障指明方向、节省时间,尽量缩短电网监控的中断时间,减少电网监视失效时间。
据公司统计,申请人所在公司远动通道故障定位时间平均值为31.5分钟,发生故障时,远动通道故障定位步骤较多,涉及到自动化、通信、检修等方面,基本都在7次以上,定位路线多、专业性较强、涉及的专业和设备多、对于定位技术手段的掌握、定位步骤的熟悉程度等都影响了定位时间。
经过申请人分析认为:无专人24小时定位通道故障、缺乏专业定位工具为主要因素;由于无专人24小时定位通道故障可能通过现有岗位具有24小时工作的人员兼顾,故申请人从缺乏专业定位工具入手,来解决缩短远动通道故障定位时间。
技术实现要素:
为解决上述问题,本发明的目的在于提供一种缩短远动通道故障定位时间的方法,本发明是采用以下技术方案来实现的。
一种缩短远动通道故障定位时间的方法,其特征在于包含以下步骤:
第10步:开始,并进入第20步;
第20步:读取host.ini,template.ini,命令行参数,初始化,并进入第30步;
第30步:判断是否已指定厂站;若否则进入第40步,反次,进入第50步;
第40步:选择厂站,并进入第50步;
第50步:选择前置主机,并进入第60步;
第60步:诊断fes主机通信状态,并进入第70步;
第70步:判断是否正常,若是,则进入第80步,反之,则进入第110步;
第80步:循环下一个目标机直到所有目标机全部检测完成,全部完成后进入第120步,反之则进入第90步;
第90步:登陆到fes主机上诊断目标机通信状态,并进入第100步;
第100步:判断通信状态是否正常,若是,则返回第80步,反之,则进入第110步;
第110步:报告错误,定位问题所在并提出解决策略;
第120步:所有主机通信正常。
上述所述的一种缩短远动通道故障定位时间的方法,其特征在于在开始步始之前,预先生成(1)pinger_show表,用于负责维护整个系统的ip与主机配置,可增删改查;该表保存后生成host.ini文件;(2)pinger_config表,用于读取host.ini文件和预定义的模板文件template.ini,并作为诊断文件。
本发明具有以下主要有益效果:有效缩短了远动通道故障定位时间、减少因远动通道故障引起的重要事故信号丢失、有效控制避免事故扩大化,可挽回多种经济损失;保持调控中心对重要信号可靠监控,保障供电质量;电网事故时能第一时间处理,缩短了事故停电时间,提高供电服务质量,提升了供电公司企业形象;减轻了检修公司运维人员工作压力。
附图说明
图1为本发明中远动通道的框图。
图2为本发明方法的流程图。
具体实施方式
请见图1和图2,一种缩短远动通道故障定位时间的方法,其特征在于包含以下步骤:
第10步:开始,并进入第20步;
第20步:读取host.ini,template.ini,命令行参数,初始化,并进入第30步;
(1)template.ini主要存储数据模型如下:
模板数据对象:
{
name:表示该模板名称。如省调交换机,地调交换机;
iptemp:为对象的ip模板。这一属性主要用于pinger_config;
enablevol:为对象使能的电压等级列表。如省调接入网只能在220kv的电压等级下使能,而地调路由则在所有电压等级下均使能;
在诊断成功/失败后的策略。不同的对象中有不同的诊断策略,引导下一步的诊断方向;
color_alive/color_die:配置诊断成功/失败后的提示颜色。该颜色是可以在不同的对象中自主选择,一般情况下是统一的黑/红两色。
}
同时,fes主机的两个策略:strategy_alive/strategy_die作用同上。
(2)host.ini主要存储数据模型如下:
厂站数据对象:
{
name:描述厂站中文名;
voltage:描述厂站电压等级;
targehosts:为诊断厂站故障时对应的目标主机ip地址列表。
}
第30步:判断是否已指定厂站;若否则进入第40步,反次,进入第50步;
程序通过命令行参数判断是否已经指定厂站,如果命令行是厂站名(英文tag,如刘集站就是liuji),则直接导入该厂站数据,隐藏左侧的厂站列表,如果命令行参数是all,则打开左侧厂站列表,自由选择厂站进行诊断。如果有不存在的厂站名,则报错退出。
根据当前厂站名,从上述厂站数据对象中取出对应的targehosts列表,遍历整个列表,生成表格插入数据。单元格第一列可以从模板对象中取出模板名,单元格第二列则为targehost的ip。对于targehost中不存在的模板不予以显示。单元格第三列插入操作按钮,最后一列预留给诊断结果策略显示。
第40步:选择厂站,并进入第50步;
第50步:选择前置主机,并进入第60步;
第60步:诊断fes主机通信状态,并进入第70步;
通过右上角的下拦框选择fes主机,在下拉框数据变化时,程序内部接收数据变化并实时切换诊断表格中的第一行数据,保持数据同步。点击ping按钮后,程序取出当前一行的fes主机的ip地址,构建如下面的命令行:
ping$fesip–c3
并在后台调用执行,该命令行的作用是执行3次对fesip的ping动作,发动snmp报文,接收响应后返回。
第70步:判断是否正常,若是,则进入第80步,反之,则进入第110步;
程序通过取到的ping命令返回值,诊断fes主机在线情况。一般情况下,在linux环境中,执行成功的命令返回0,失败的命令返回非0。这时只需要取出ping命令的返回值,即可得知fes主机是否在线。根据结果,取出fes主机的strategy_aive/die策略,显示在列表最后一列单元格内,引导下一步动作。
第80步:循环下一个目标机直到所有目标机全部检测完成,全部完成后进入第120步,反之则进入第90步;
第90步:登陆到fes主机上诊断目标机通信状态,并进入第100步;
根据fes主机诊断后的策略的引导,选择对应的主机,点击ping按钮进行诊断。目标主机的诊断动作与fes不同,因为需要通过fes主机进行远程诊断。点击ping按钮后,程序取出当第一行的fes主机的ip地址,和当前一行主机的ip地址,构建如下面的命令行:
rsh$fesip“ping$hostip–n3”
并在后台调用执行,该命令行的作用是登陆到fes主机上,在fes主机上执行3次对hostip的ping动作,发动snmp报文,接收响应后返回。注意这里的ping命令参数是-n而不是-c,主要原因是因为系统版本不一样,自带的ping命令行参数不同,而原理都是一样的,该参数指定了ping的次数
第100步:判断通信状态是否正常,若是,则返回第80步,反之,则进入第110步;
目标主机的诊断动作与fes不同,由于fes主机系统限制,预装的rsh命令并不返回ping命令的返回值,只要系统调用成功一律返回0,所以通过判断rsh命令的返回值无法确定hostip对应的主机的状态。我们通过对ping命令的返回输出做分析来实现状态诊断。一个典型的ping命令输出如下:
---www.a.shifen.compingstatistics---
3packetstransmitted,3received,0%packetloss,time2018ms
rttmin/avg/max/mdev=12.941/13.373/13.661/0.325ms
注意倒数第二行的显示数据,该数据显示了诊断操作的失败率。即使在网络非常拥堵的情况下,ping程序的诊断也不会出现100%packetloss的情况,在网络畅通的情况下都是0%,在很拥堵的情况下也有最多60%~70%的丢包率。只有在网络不可达的情况下,才会出现100%的丢包。所以通过解析该ping输出,取出丢包率的数值,如果小于100,则可以认定该主机是通信正常的。
第110步:报告错误,定位问题所在并提出解决策略;
根据该主机诊断结果,取出该主机对应的strategy_alve/die策略,显示在列表最后一列单元格内,并通过color_alive/die进行高亮显示,引导下一步动作。预设的strategy一般有两种状态:
如果执行成功,则说明问题不在这一层,引导你进入另一个主机诊断,进一步缩小故障范围。
如果失败,则说明问题在这一层,引导你进行通信操作,及时排查故障。
注意,在ping命令执行的时候,切断该表格其它所有其它ping按钮的响应操作。诊断动作应该是流水式的,按照诊断策略一步一步走,不应该出现并行诊断的情况。该设计可以防止误操作。
第120步:所有主机通信正常。
上述所述的一种缩短远动通道故障定位时间的方法,其特征在于在开始步始之前,预先生成(1)pinger_show表,用于负责维护整个系统的ip与主机配置,可增删改查;该表保存后生成host.ini文件;(2)pinger_config表,用于读取host.ini文件和预定义的模板文件template.ini,并做为诊断文件。
本发明的使用,使得远动通道故障定位时间从活动前的31.5min降到1.03min,故障定位时间显著降低,同时,非工作时间与工作时间的远动通道故障定位时间基本一致;按申请人所在的公司110kv变压器平均负荷为29.681mw,当变电站通道故障时,若发生故障跳闸,按照主变50%损失负荷计算,缩短通道故障时间30.5min,1度电按0.56元计算,即单次发生事故跳闸,可挽回42218.12元经济损失;该方法同时保持调控中心对电压的可靠监控,提高了供电电压质量;电网事故时能第一时间处理,缩短了事故停电时间,提高供电服务质量,提升了供电公司企业形象;减轻了检修公司运维人员工作压力。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下做出各种变化。