信息归纳分析方法及装置的制造方法
【技术领域】
[0001] 本发明属于IT应用技术领域,尤其涉及一种对信息归纳分析的方法和装置。
【背景技术】
[0002] 随着信息技术的发展,政府机构、企事业单位、公益机构和国家安全部门等都积累 了海量的数据信息,在一些情况下,需要从该数据信息中的部分数据里提取需要的信息,而 由于这些媒体数据信息之间并没有建立直接的关联关系,无法直接用搜索引擎检索,通常 只能通过人工过滤、分析、确认的方法进行信息提取,该方法使得信息提取的工作量巨大, 又由于信息归纳分析涉及语音检测与识别、图像检测与识别、文本分析等人工智能技术,较 为复杂,所以,在数据分析应用中,还是主要依赖人工分析确认,这就产生了巨大的人工成 本,也增加了信息分析的周期。
[0003] 例如,每个城市的交警队都通过交通监控系统摄取了大量视频录像资料,由于工 作量大和技术的原因,这些视频资料中的车辆信息目前是不做内容检索的,只有在出现交 通事故后,如果发生车辆逃逸,需要对逃逸车辆进行轨迹追踪时,通过人工浏览各可能经过 路线的录像资料查找相关逃逸车辆的逃逸路线及其他信息。
[0004] 此外,在有些应用中,采用大数据分析技术,可以对部分静态信息进行过滤和提 取,但是,大数据分析侧重于信息状态发展趋势的分析,对于实时性处理要求较高和现场应 用的环境,还不适合。同时,大数据不以信息处理中查全为主,对于查全率要求高的应用也 不适合。
【发明内容】
[0005] 为了解决现有信息归纳分析方法主要依靠人工信息筛选完成,造成的分析周期 长,人力成本投入巨大且查全虑不高的技术问题,本发明提供了一种信息归纳分析方法及 装置,用以减小人工信息筛选范围,将需要阅览的海量数据信息转变为阅览与目标相关的 有效?目息,提尚有用?目息的提取效率。
[0006] 为了实现上述目的,本发明采用的技术方案为:一种信息归纳分析方法,包括如下 步骤:
[0007] SI.根据使用者提供的输入数据信息的类型,对输入数据信息中涉及的文本、语 音、图片和视频中的一种或多种数据信息提取特征数据,并加载、释放对应的样本模型库;
[0008] S2.动态加载检测引擎以对所述特征数据追踪识别处理,在样本模型库中找到疑 似目标;
[0009] S3.预置关联条件以得到疑似目标之间的关联性,确定各疑似目标的相似性;
[0010] S4.得到输出数据信息,所述输出的数据信息包括媒体文件或媒体流中出现的疑 似目标的所在位置。
[0011] 作为技术方案的补充,所述输入数据信息为文本、语音、图片和视频中;所述样本 模型库,包括文本分析用的文本特征库,语音处理用的声纹模型库及声学和语言模型库,图 片处理和视频处理用的物体形体特征模型库、人脸特征模型库、颜色特征模型库和物体纹 理特征模型库;所述样本模型库的加载由动态加载、云端服务器或集群模型库中加载、本地 模型库加载和USB设备加载中任意加载方式实现。
[0012] 作为技术方案的补充,根据输入数据信息的类型,自动启动相应的服务引擎;根据 系统状态,控制各服务引擎进程;在网络环境下,输入信息由接收云端或集群服务端的待检 测数据文件或接收IP媒体流的方式得到。
[0013] 作为技术方案的补充,动态加载的检测引擎来自于云端服务器、集群引擎库、本地 引擎库及USB设备中的一种或多种;对所述生物特征数据进行追踪识别处理时,其包括语 音关键词识别、图像检测、图像识别、颜色识别、物体大小识别、纹理分析、音视频特征比对 和多种引擎协同并行处理的方法中的多种组合。
[0014] 作为技术方案的进一步补充,在对所述生物特征数据进行追踪识别处理时,还进 行如下一种或多种操作:设置和/或调整检测目标、调整检测顺序、增加同一检测目标的检 测要素。
[0015] 作为技术方案的补充,输出信息还包括,出现该疑似目标的音频、视频文件的名 称、疑似目标出现的入点时间和时长;出现该疑似目标的音频流、视频流媒体的名称:疑似 目标出现的入点时间和时长;出现该疑似目标的图片文件的文件名列表和存储路径,在输 出信息后,将媒体文件或媒体流中出现的疑似目标的所在位置的媒体片段留存和/或提 取。
[0016] 作为技术方案的补充,还包括对相似的疑似目标进行聚类汇编,并以时间顺序、位 置信息为主线展示。
[0017] 作为技术方案的补充,设置有网络集群运行和单机独立运行两种模式,并提供有 网络端口,自动检测网络链接状态,处于离线状态时,自动或手动切换到独立运行状态;处 于网络连接状态时,根据配置信息,自动运行在集群模式或独立运行模式。
[0018] 作为技术方案的补充,使用该方法时涉及的各功能模块和引擎之间的数据交换, 通过消息机制实现,消息格式有标准定义,系统提供消息池进行管理,定义消息触发、推送 机制,各引擎之间有消息确认机制,实时了解引擎的工作状态,在出现引擎宕机故障时,启 动重启机制;
[0019] 设置系统故障监测管理为独立进程,实时采集各功能模块的状态信息,在发现软 件或硬件故障时发出报警消息,在功能模块宕机时触发重启功能模块机制,应用该方法的 系统宕机时重启整个系统,在网络集群运行模式下,各设备间的故障监测管理进程之间会 实时汇总设备状态到主设备。
[0020] 一种使用所述的信息归纳分析方法的信息归纳分析装置,
[0021] 加载、释放样本模型库模块,根据使用者提供的输入数据信息的类型,对输入数据 信息中涉及的文本、语音、图片和视频中的一种或多种数据信息提取特征数据,并加载、释 放对应的样本模型库;
[0022] 特征数据提取模块,动态加载检测引擎以对所述特征数据追踪识别处理,在样本 模型库中找到疑似目标;
[0023] 疑似目标查找模块,动态加载检测引擎以对所述生物特征数据追踪识别处理,找 到疑似目标;
[0024] 关联模块,预置关联条件以得到疑似目标之间的关联性,确定各疑似目标的相似 性;
[0025] 输出模块,得到输出数据信息,所述输出的数据信息包括媒体文件或媒体流中出 现的疑似目标的所在位置。
[0026] 有益效果:该所述信息归纳分析方法及装置,针对可提供的疑是目标的关键词、图 片、语音中的单一信息进行检测,追踪发现关联信息并输出,可以减小人工信息筛选范围, 将需要阅览的海量数据信息转变为阅览与目标相关的有效信息,提高有用信息的提取效 率。
【附图说明】
[0027] 图1为实施例1中的各分类信息提取的特征信息与样本模型库对应的示意图;
[0028] 图2为实施例5中的装置统一管理控制引擎的加载、运行和释放的示意图;
[0029] 图3为实施例4中的装置的内部功能模块连接的示意图;
[0030] 图4为实施例1中所述信息归纳分析方法的流程示意图。
【具体实施方式】
[0031] 实施例1 : 一种信息归纳分析方法,包括如下步骤:
[0032] SI.根据使用者提供的输入数据信息的类型,对输入数据信息中涉及的文本、语 音、图片和视频中的一种或多种数据信息提取特征数据,并加载、释放对应的样本模型库;
[0033] 具体的,所述输入数据信息为文本、语音、图片和视频中,尤其是,本方法可以 接收网络文件数据和网络流媒体数据,数据格式:视频及流媒体支持AVI、MPEG-1/2/4, Η· 263/264/265, M-JPEG、MP4 ;音频支持:WAV、MP3、PCM ;图片支持:BMP、JPG/JPEG、Gif、 Tiff、PNG