专利名称:用于对电力输送控制系统的性能进行监控的方法和装置的制作方法
技术领域:
本发明涉及控制系统,并且更具体而言涉及对电力输送控制系统的运行状况的监 测和监管。
背景技术:
电力输送系统包括监控与数据采集(SCADA)系统、配电管理系统(DMS)、能量管理 系统(EMS)和发电管理系统(GMS)。这样的系统因其对于公众的重要性而必须具备高度的 可用性和可靠性。自从1920和1930年代首次研发出用于电厂的远程控制系统(比如由 ASEA AB和Brown Boveri Company所研发)起,电力控制系统已经演化成为强大而复杂的 信息技术(IT)系统,其使得设施能够高效地管理它们的电网并且可靠地向终端用户输送 电力。为了维持这些复杂控制系统的可靠性和可用性,十分重要的是检测和识别控制系统 中的故障并于故障已经发生后分析错误状况以防止将来的故障。软件工具可用于监测和监管计算机的运行状况。然而,这些工具往往是由计算机 厂商和/或操作系统厂商提供的,并且通常局限于操作系统(0/S)工具。并且,这些工具和 其它可用的常规工具具有以下缺点(1.)所述工具无法以控制系统中所需的频率(即,在 某些情况中亚秒级的频率)收集和存储数据;(2.)利用工具所得到的数据对于故障诊断而 言(在时间间隔上和在数据值上)粒度不足;(3.)工具具有很大的CPU/存储器/存储盘 /网络足迹,这可能进一步对系统造成问题;(4.)来自不同厂商的工具无法对数据执行相 关,因为它们以不同的周期时间来收集数据;以及(5.)以不同格式或在不同的显示器上呈 现,这使得对数据的查看和分析颇为繁琐、易错且缓慢。常规0/S工具的具体例子包括0/S标准计数器工具(即,vmstat, iostat)和0/S 定制内核工具(即,glanCe、C0lleCt)。由0/S标准计数器工具所产生的数据就其属性而言 并非是历史性的,并且与任何特定处理动作都没有联系。由0/S定制内核工具所提供的数 据的粒度不足,未经标准化,并且并非为系统上运行的应用而特制。因此,不能在一个收集 周期中搜集和存储来自由应用所使用的不同类型资源的数据。由应用工具(例如,电力系统应用、数据库应用等)所提供的数据一般而言粒度非 常小,而且不是为了历史使用情况或者运行时期监测而设计的。此外,这些工具被开发用以 诊断具体的和孤立的问题区域,并且通常不适于在利用系统、服务器、应用和通信协议的组 合的环境(比如在现代电力输送控制系统)中使用。结合运行的独立工具使用大量的硬件 和软件资源,这样增加了系统上的总负荷,而这与原先使用所述工具的初衷是背道而驰的。基于以上所述情况,存在对于适合在控制系统中使用的监测工具的需要。本发明 针对的是这样一种监测工具。
发明内容
依据本发明,提供一种计算机实施的方法,用于对适合于监测和控制电力输送操 作的控制系统的操作进行监测。该控制系统具有多个计算机。每个计算机具有中央处理器 (CPU),在该中央处理器上运行有操作系统,且每个操作系统具有一个或多个内核接口。依 据所述方法,确定每个计算机上运行有什么进程。接收用于数据收集的阈值标准。基于每 个计算机上运行的进程来收集初始数据。给初始数据打上时间戳。确定初始数据是否满足 任何阈值标准。如果初始数据满足任何阈值标准,则基于已被满足的阈值标准来收集额外 的数据。给额外的数据打上时间戳。使用时间戳和/或运行中的进程的特征使初始数据与 额外数据相关。继而显示已被相关的收集到的数据。内核接口用于收集初始数据集和额外 数据。依据本发明,还提供了 一种适于监测和控制电力输送操作的控制系统。该控制系 统包括现场设备、关联于所述现场设备的一个或多个远程终端单元(RTU)以及多个计算 机,多个计算机包括适于从所述一个或多个RTU接收数据的数据采集计算机,以及可操作 执行用于控制一个或多个所述现场设备的应用的应用计算机。每个计算机包括中央处理器 (CPU)和计算机可读介质,所述计算机可读介质包含具有一个或多个内核接口和监测工具 的操作系统软件,该操作系统软件在由CPU运行时执行对计算机的操作进行监测的方法。 依据该方法,确定计算机上运行有什么进程。接收用于数据收集的阈值标准。基于运行于 计算机上的进程来收集初始数据。给初始数据打上时间戳。确定初始数据是否满足任何阈 值标准。如果初始数据满足任何阈值标准,则基于已被满足的阈值标准来收集额外的数据。 给额外的数据打上时间戳。使用时间戳和/或运行的进程的特征使初始数据与额外数据相 关。继而显示已被相关的收集到的数据。内核接口用于收集初始数据集和额外的数据。
本发明的特征、方面和优点将参考以下描述、随附权利要求书以及附图而得到更 好的理解,在附图中图1是用于电力输送操作的控制系统的示意图;图2是控制系统中计算机的图形用户界面(GUI)中的屏幕截图,其中该屏幕截图 示出了计算机的进程树;图3是一种由本发明的监测工具所执行的方法的流程图;图4是控制系统中计算机的GUI中的屏幕截图,其中该屏幕截图示出了收集到的 进程数据;图5是控制系统中计算机的GUI中的屏幕截图,其中该屏幕截图示出收集到的CPU 状态数据;以及图6是控制系统中计算机的GUI中的屏幕截图,其中该屏幕截图示出收集到的进 程数据。
具体实施例方式应当注意,在以下详细描述中,相同组件具有相同附图标记,无论所述组件是否被示出于本发明的不同实施方式中。还应当注意,为了简明扼要地公开本发明,附图不一定是 按照比例绘制的,并且本发明的某些特征可能以略具示意性的形式示出。现在参考图1,示出了适于监测和控制电力输送操作的SCADA系统10。SCADA系统 10 一般包括一个或多个操作员控制台12、历史计算机14、历史服务器计算机16、一个或多 个实时应用服务器计算机18、一个或多个数据采集服务器计算机20以及一个或远程终端 单元(RTU) 22。每个操作员控制台12可以是具有中央处理器(CPU)和用于向操作员提供可视化 显示的监视器的个人计算机(PC)。图形用户界面(GUI)运行于每个操作员控制台12之上, 并且可操作用以在监视器上显示多个不同视图或视窗。SCADA系统10中的每个计算机具有操作系统。众所周知,操作系统是负责控制和 管理计算机资源的系统软件。典型的操作系统能实现计算机的应用软件与硬件之间的通 信。操作系统允许应用访问计算机的硬件和基本系统操作,比如磁盘访问、存储器管理、任 务调度和用户接口连接。此外,操作系统还负责提供网络连接性。SCADA系统10中计算机的 操作系统可以是可从MicrosoftCorporation获得的Windows 操作系统或者可从比如 HewlettPackard, Sun Microsystems、IBM、RedHat, SUSE 等厂商处购得的不同类型的 Unix 操作系统 aru64、HP-UX、Linux)。SCADA系统10中每个计算机的每个操作系统均具有内核接口。内核接口是进程 (应用程序)与操作系统的内核之间的低级别通信桥梁。用于进程的内核接口通常包括入 口点和调用约定。入口点是进程的执行进入内核之处,而调用约定则控制如何将函数参数 传递至内核以及如何取回返回值。操作系统的内核接口可以包括开始和停止执行线程的函数,用以同步执行线程、 对文件进行读写数据、在共享存储器的区域中进行征募(enlist)、在屏幕上绘图、与网络进 行通信或者读取系统时钟。内核接口的范围可能从数十个入口点到数百个甚至数千个入口
点ο内核接口是呈现给程序员的操作系统的应用编程接口(API)的一个组件。API通 常定义应用程序员的源代码与操作系统库之间的接口,以使得相同的源代码将在任何支持 API的系统上编译。许多常规操作系统将内核接口封装在高级API之中,因为内核接口因内 核版本不同而不同。一个或多个操作员控制台和历史计算机14与第一网络M相连,而应用服务器计 算机18和数据采集服务器计算机20与第二网络沈相连。第一网络M和第二网络沈可 以各自包括成对的冗余以太网电缆,在其上使用TCP/IP协议来通信传送信息。RTU 22是基于微处理器的设备,其关联于配电系统中的现场设备,比如自动重合 开关、继电器、开关、断续器、电容器组等。RTU22基本上是通信接口,并且可以直接集成到现 场设备之中,或者,更常见的是作为外部通信单元连接到现场设备。RTU 22被数据采集服 务器计算机20定期地询问或“轮询”,并且RTU 22使用从其关联的现场设备或系统搜集的 数据作出响应。询问可以是有针对性的(这表示数据采集服务器计算机20使用某种形式 的唯一标识符来联络特定的RTU 22),或者是全局性的(在这种情况中数据采集服务器计 算机20发送单个轮询,并且所有接收到该轮询的RTU 22根据某种预定响应顺序依次作出 响应)。RTU 22可以使用分布式网络协议(DNP)与数据采集服务器计算机20进行通信,所述分布式网络协议是用于SCADA系统中的控制和通信的开放协议。DNP处理三种类型的数 据二进制、模拟和计数器的数据。计数器数据表示比如千瓦时之类的计数值,这些计数值 一直增加直至达到最大值,并继而折返回0并再次开始计数。DNP不是用于传输超文本、多 媒体或大文件的通用协议。DNP 3.0是DNP的最新版本。应用服务器计算机18可以执行一个或多个应用,以用于使用比如可从数据采集 服务器计算机20获得的现场信息来控制和/或优化电力输送操作的性能。监测(软件)程序或工具50的副本运行于SCADA系统10的一个或多个计算机 上,比如在操作员控制台12和/或应用服务器计算机18和/或数据采集服务器计算机20 上。在其上运行有监测软件程序副本的计算机应在下文中被称为“主机计算机”。在本发明 的一个实施方式中,监测工具50的副本安装于SCADA系统10中的每个计算机上。在该实 施方式中,监测工具50的副本相互通信,并且副本之一可以充当能够控制其它副本的“主 副本”。监测工具50的每个副本可在主机计算机启动时、依据操作员的命令下或者依据另 一计算机程序的命令,自动执行。在本发明的一个实施方式中,监测工具50是自主的独立 进程,其在作为SCADA系统10的一部分的所有计算机上的操作系统重启时自动启动。在每个主机计算机上,监测工具50存储在存储器中,并且由主机计算机的中央处 理单元(CPU)执行。监测工具50包括显示在主机计算机的监视器上的图形用户界面(GUI)。 为了显示数据用于模式识别,⑶I可以在适当情况下利用数据图以相同时间间隔显示所有 收集到的数据。此外,GUI可以用于(i)在运行时或历史数据上筛选特定数据类型和时间, ( )生成图形和详细数据,并以并排方式显示,(iii)生成用于数据的颜色编码的高位标 志并显示,以及(iv)生成进程的景况图,并以允许对问题点进行容易识别的方式显示。监测工具50具有以下运行时属性(1.)监测工具50作为后台进程连续执行; (2.)监测工具50使用非常小的紧凑数据和代码段本地编译;(3.)监测工具50能够在多种 操作平台上运行;(4.)监测工具50使用由供应商提供的数据源内核接口 ;(5.)监测工具 50不使用内核符号映射方法;(6.)监测工具50在特殊权限用户的环境下运行;(7.)监测 工具50具有比大多数其他应用更高的优先级设置;(8.)监测工具50以一秒以下的频率基 于内部循环计时器运行;以及(9.)监测工具50在任何时刻的耗费都不会多于其主机计算 机的CPU处理占用率的5% ;以及(10.)监测工具50占用其主机计算机的总存储器的
的10%以下。 监测工具50最初在主机计算机的存储器中创建空间,用以存储用于多达10000个 独立条目的选定进程/线程数据。内部保持的线程/进程表中的条目使用以下简单散列公 式进行索引HASH_INDEX = (THREAD_ID << 1% 10000)。其中HASH_INDEX是到本地线程表中的索引THREAD_ID是线程的操作系统标识符<< 1是单个位元左移操作% 10000是对10000求模操作监测工具50监测并分析主机计算机的进程结构。主机计算机的进程结构是被安 装并且运行于主机计算机之上的各种可执行软件程序(进程)。现在参考图2,示出了主机 计算机(比如操作员控制台12之一)的进程资源管理器视窗的屏幕截图,其部分地示出主 机计算机的进程结构。如图所示,该进程结构包括“winlogon” (登录进程)、“Smss” (会话管理器服务)和“timesync”(时间同步服务)。最初取得机器重要配置信息的清单,这些配置比如包括磁盘/CPU数量、存储器大 小和网络容量。该配置信息可以包括在由监测工具50生成的报告之中。在收集周期开始 时,对CPU、存储器、磁盘、进程/线程、进程间通信方法和网络使用的标准度量进行收集、存 储、再收集并继而进行分析。当突破对于任何标准度量的可配置使用阈值,或者满足度量规 则的组合时,在相同处理周期内开始详细收集处理。该意外事件信息存储到独立的时间戳 文件中。一旦事件被报告,则使用退避时间算法来防止意外事件文件以高频率出现。监测工具50仅使用内核接口从主机计算机收集数据。监测工具50可以使用到进 程的内核接口从每个进程选择性地收集特定时间间隔的数据。可由监测工具50从主机计 算机的进程中收集的数据包括CPU、磁盘、存储器、网络和进程统计;占用百分比(整体、进 程);进程/线程状态百分比;运行队列平均值;已处理的中断;执行的上下文切换;以及进 行的系统调用。使用SCADA系统10的系统时间戳或者外部时钟给由监测工具50收集的数 据打上时间戳。监测工具50允许使用时间戳和/或进程分析对不同数据类型进行相关。例如,监 测工具50可以对来自根据时间戳而被确定是同时执行的那些进程的数据进行相关。监测 工具50还可以对来自那些使用相同文件I/O的进程的数据进行相关。监测工具50还可以 追踪进程依赖性,即,父子关系,比如图2的树中所示的关系。如上文所述,监测工具50使用阈值设置来开始和停止详细数据的收集和存储。阈 值设置可以是用户通过主机计算机的GUI可选择的。收集到的详细数据可以由历史计算机 14存储在历史服务器计算机16中并由历史计算机14从其中取回。使用阈值设置来开始 和停止详细数据收集的一个例子可以是75%的系统CPU占用率。当系统CPU占用率大于 75%时,监测工具50可以开始收集、打时间戳和存储所有可从内核接口获得的数据。当系 统CPU占用率随后降至65%以下时,监测工具50可以停止收集和存储可从内核接口获得的 数据。可以用来开始数据收集的阈值的另一例子是文件交换。如果文件交换变得活跃,则 可以收集关于存储器使用的数据并对其打时间戳和存储。详细收集进程和触发它们的度量(阈值)的更多例子列举如下
标准度量(突破的阈值)详细收集CPU使用CPU的最高线程消耗者的调用帧存储器使用存储器的最高线程 肖耗者的调用
权利要求
1.一种对适用于监测和控制电力输送操作的控制系统的操作进行监测的计算机实施 的方法,所述控制系统具有多个计算机,每个所述计算机具有中央处理单元(CPU),在中央 处理单元上运行有操作系统,并且每个所述操作系统具有一个或多个内核接口,所述方法 包括(a.)确定每个计算机上正在运行什么进程;(b.)接收用于数据收集的阈值标准;(c.)基于运行于每个计算机上的所述进程收集初始数据;(d.)给所述初始数据打上时间戳;(e.)确定所述初始数据是否满足任何所述阈值标准;(f.)如果所述初始数据满足任何所述阈值标准,则基于已被满足的所述阈值标准收集 额外的数据;(g.)给所述额外的数据时间戳;(h.)使用所述时间戳和/或运行中的所述进程的特征来使所述初始数据和所述额外 的数据相关;以及(i.)显示已被相关的、收集到的数据;以及其中所述内核接口用于收集所述初始数据集和所述额外的数据。
2.根据权利要求1的方法,其中所述方法在所述控制系统正在对所述电力输送操作进 行控制和监测的同时进行。
3.根据权利要求2的方法,其中每个所述计算机都执行所述方法。
4.根据权利要求3的方法,其中所述方法由每个计算机执行的消耗小于所述计算机 CPU处理占用率的5%。
5.根据权利要求2的方法,其中所述控制系统是SCADA系统,并且所述计算机包括一个 或多个数据采集服务器计算机。
6.根据权利要求5的方法,其中所述控制系统包括多个远程终端单元(RTU),所述远程 终端单元使用分布式网络协议(DNP)与所述一个或多个数据采集服务器计算机进行通信。
7.根据权利要求1的方法,其中所述关联的步骤包括确定根据所述时间戳而确定的同 时执行的进程。
8.根据权利要求1的方法,其中所述接收用于数据收集的阈值标准的步骤通过图形用 户界面执行。
9.根据权利要求1的方法,其中所述阈值标准包括对于每个计算机的CPU使用限制,并 且其中当对于所述计算机中的一个计算机,CPU使用限制被超过时,收集到的所述额外的数 据包括所述计算机中的这一个计算机的CPU的最高线程消耗者的调用帧。
10.根据权利要求1的方法,其中所述步骤(e.)、(f.)和(g.)在一秒内或者更短时间 内执行。
11.一种适于监测和控制电力输送操作的控制系统,所述控制系统包括 现场设备;关联于所述现场设备的一个或多个远程终端单元(RTU);多个计算机,包括数据采集计算机,适于从所述一个或多个RTU接收数据;以及应用 计算机,可操作用以执行用于控制一个或多个所述现场设备的应用,每个所述计算机包括中央处理器(CPU)和计算机可读介质,该计算机可读介质包含具有一个或多个内核接口和 监测工具的操作系统软件,所述操作系统软件在由所述CPU执行时,执行一种监测所述计 算机的操作的方法,所述方法包括(a.)确定每个计算机上正在运行什么进程;(b.)接收用于数据收集的阈值标准;(c.)基于运行于所述计算机上的进程收集初始数据;(d.)给所述初始数据打上时间戳;(e.)确定所述初始数据是否满足任何所述阈值标准;(f.)如果所述初始数据满足任何所述阈值标准,则基于已被满足的所述阈值标准收集 额外的数据;(g.)给所述额外的数据打上时间戳;(h.)使用所述时间戳和/或运行中的所述进程的特征来使所述初始数据和所述额外 数据相关;以及(i.)显示已被相关的收集到的数据;以及其中所述内核接口用于收集所述初始数据集和所述额外的数据。
12.根据权利要求11的控制系统,其中所述方法在所述控制系统正在对所述电力输送 操作进行控制和监测的同时进行。
13.根据权利要求12的控制系统,其中在每个计算机中,所述监测工具在所述操作系 统启动时自动开始执行,并于此后作为后台进程而持续运行。
14.根据权利要求12的控制系统,其中所述方法执行的消耗小于所述计算机总CPU处 理占用率的5%。
15.根据权利要求11的控制系统,其中在所述方法中,接收用于数据收集的阈值标准 的步骤通过图形用户界面执行。
16.根据权利要求11的控制系统,其中所述阈值标准包括对于每个计算机的CPU使用 限制,并且其中当对于所述计算机中的一个计算机,CPU使用限制被超过时,收集到的所述 额外的数据包括所述计算机中的这一个计算机的CPU的最高线程消耗者的调用帧。
17.根据权利要求11的控制系统,其中所述数据采集计算机使用分布式网络协议 (DNP)与所述一个或多个RTU进行通信。
18.根据权利要求11的控制系统,其中所述数据采集计算机中的监测工具与所述应用 计算机中的监测工具通信。
19.根据权利要求11的控制系统,其中步骤(e.)、(f.)和(g.)在一秒内或者更短时 间内执行。
20.根据权利要求11的控制系统,其中所述现场设备选自以下组,该组包括自动重合 开关、继电器、开关、断续器、电容器组及前述各项的组合。
全文摘要
本发明提供了一种电力输送控制系统以及一种对其进行监控的方法。该控制系统包括多个计算机。基于在每个计算机上运行的进程来收集初始数据。如果该初始数据满足阈值标准,收集更多详细数据以促进根本原因分析,使用操作系统内核接口来收集所有数据,给其打上时间戳。在每个计算机上,可以在GUI中显示相关的收集到的数据。
文档编号G06F1/26GK102112940SQ200980130766
公开日2011年6月29日 申请日期2009年6月2日 优先权日2008年6月2日
发明者C·费特尔, C·辛塞尔博克斯, D·麦克丹尼尔, K·沙尔 申请人:Abb技术有限公司