事件属性语句确定及基于事件属性语句预警方法和装置的制造方法

文档序号:9818312阅读:456来源:国知局
事件属性语句确定及基于事件属性语句预警方法和装置的制造方法
【技术领域】
[0001]本发明实施例涉及数据处理技术,尤其涉及一种事件属性语句确定及基于事件属性语句预警方法和装置。
【背景技术】
[0002]在现实生活中有很多事件,尤其是金融事件,是可以通过对一些现有数据的运算处理来进行预测的。其中,量化投资就是一项非常典型的针对金融投资事件的预测方法。
[0003]所谓量化投资,就是指借助现代统计学、数学的方法,从海量历史数据中寻找能够带来超额收益的多种“大概率”策略,并纪律严明地按照这些策略所构建的数量化模型来指导投资,力求取得稳定的、可持续的、高于平均的超额回报。与传统的定性投资方法不同的是,量化投资不依靠人的感觉来管理资产,而是根据人的投资思想和投资经验来构建数学模型,并利用计算机来处理大量历史数据,在较短的时间内验证模型的有效性,只有当模型在历史数据上的表现满足要求时,才会被进一步应用到实盘交易中。
[0004]现有技术中的量化投资方法都是基于已有的股票量价数据实现的。而由于量价数据中的噪音较多且数据完全公开,仅仅以此为数据源构建有效的投资策略难度极大,往往收效甚微。原因是股票投资本质上是一种博弈行为,只依据完全公开的信息进行决策没有任何优势。

【发明内容】

[0005]有鉴于此,本发明实施例提供一种事件属性语句确定及基于事件属性语句预警方法和装置,以优化现有的事件预测技术,提高事件预测的精准度。
[0006]在第一方面,本发明实施例提供了一种事件属性语句的确定方法,包括:
[0007]获取与目标事件相关联的多个待测语句,其中,所述语句包括:词、词组以及包含变量的句子;
[0008]根据各所述待测语句在网络数据库中出现次数随时间的变化规律,获取与各所述待测语句的异常出现次数对应的异常时间,其中,所述网络数据库中的内容包括时间标签;
[0009]根据各所述待测语句的所述异常时间与所述目标事件历史发生时间的关系,确定与所述目标事件对应的事件属性语句。
[0010]在第二方面,本发明实施例提供了一种基于事件属性语句的预警方法,包括:
[0011]采用本发明实施例提供的事件属性语句的确定方法确定与目标事件对应的事件属性语句;
[0012]实时监测互联网数据,如果识别到所述事件属性语句在设定时间区间内的出现次数发生异常,则对所述目标事件进行预警。
[0013]在第三方面,本发明实施例提供了一种事件属性语句的确定装置,包括:
[0014]待测语句获取模块,用于获取与目标事件相关联的多个待测语句,其中,所述语句包括:词、词组以及包含变量的句子;
[0015]异常时间获取模块,用于根据各所述待测语句在网络数据库中出现次数随时间的变化规律,获取与各所述待测语句的异常出现次数对应的异常时间,其中,所述网络数据库中的内容包括时间标签;
[0016]属性语句确定模块,用于根据各所述待测语句的所述异常时间与所述目标事件历史发生时间的关系,确定与所述目标事件对应的事件属性语句。
[0017]在第四方面,本发明实施例提供了一种基于事件属性语句的预警装置,包括:
[0018]事件属性语句确定模块,用于本发明实施例提供的事件属性语句的确定装置确定与目标事件对应的事件属性语句;
[0019]目标事件预警模块,用于实时监测互联网数据,如果识别到所述事件属性语句在设定时间区间内的出现次数发生异常,则对所述目标事件进行预警。
[0020]本发明实施例通过根据与目标事件关联的待测语句在网络数据库中出现次数随时间的变化规律,获取与各待测语句的异常出现次数对应的异常时间,并根据各待测语句的异常时间与目标事件历史发生时间的关系,确定与所述目标事件对应的事件属性语句的技术手段,实现了基于互联网中的大数据,将某段时间内网络中出现次数异常的语句与目标事件的发生建立关系,找到对目标事件具有预测作用的事件属性语句,进而可以实现根据事件属性语句在网络数据中的出现情况对该目标事件进行预测的技术效果,优化了现有的事件预测技术,提高了事件预测的精准度。
【附图说明】
[0021]图1是本发明第一实施例的一种事件属性语句的确定方法的流程图;
[0022]图2是本发明第二实施例的一种待测语句在网络数据库中出现次数随时间变化的示意图;
[0023]图3是本发明第二实施例的一种事件属性语句的确定方法的流程图;
[0024]图4是本发明第三实施例的一种事件属性语句的确定方法的流程图;
[0025]图5是本发明第四实施例的一种基于事件属性语句的预警方法的流程图;
[0026]图6是本发明第五实施例的一种事件属性语句的确定装置的结构图;
[0027]图7是本发明第六实施例的一种基于事件属性语句的预警装置的结构图。
【具体实施方式】
[0028]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0029]第一实施例
[0030]图1为本发明第一实施例提供的一种事件属性语句的确定方法的流程图,本实施例的方法可以由事件属性语句的确定装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于用于存储海量互联网数据内容的服务器中,其中,所述服务器可以为单个服务器,也可以为多个服务器构成的集群服务器。
[0031 ]本实施例的方法具体包括:
[0032]110、获取与目标事件相关联的多个待测语句,其中,所述语句包括:词、词组以及包含变量的句子。
[0033]在本实施例中,所述目标事件具体可以包括可重复发生的,且会被特定因素(或者说偶发事件)直接或者间接影响的事件,典型的,金融类事件。例如:股市上涨或者下跌事件、房市上涨或者下跌事件以及设定商品价格的上涨或者下跌事件等。
[0034]其中,与目标事件相关联的待测语句具体是指会对该目标事件的发生产生影响的偶发事件所对应的词、词组或者包含有变量的句子。本发明实施例的技术方案就是通过对待测语句进行一定的数据处理,以获取待测语句中对目标事件有预测作用的事件属性语句。
[0035]举例而言,“跳楼”、“破产”等词;“宣布重组”、“资产评估”等词组;以及“XX被立案调查”、“XX非公开发行”、“XX10送10”等以“XX”为变量的句子;这些语句所对应的偶发事件都会对股市下跌事件产生直接或者间接的影响。因此可以将上述语句作为与股市下跌事件相关联的待测语句。
[0036]在本实施例中,获取与目标事件相关联的多个待测语句具体可以包括:
[0037]获取与所述目标事件所属领域相关联的备选语句集;将所述备选语句集中各备选语句与所述网络数据库中的内容进行匹配,并根据匹配结果对各备选语句进行权重排序;根据排序结果,获取设定数目的备选语句作为所述待测语句。
[0038]也可以包括:获取由所述目标事件各个历史发生时间所确定的时间区间;在与所述目标事件所属领域对应的网络数据库中,将位于所述时间区间内的内容中包括的各个语句进行权重排序;根据排序结果,获取设定数目的语句作为所述待测语句。
[0039]当然,还可以采取其他的方式获取与目标事件相关联的多个待测语句,例如:人工选定等,本实施例对此并不进行限制。
[0040]120、根据各所述待测语句在网络数据库中出现次数随时间的变化规律,获取与各所述待测语句的异常出现次数对应的异常时间,其中,所述网络数据库中的内容包括时间标签。
[0041]在本实施例中,所述网络数据库具体可以包括:搜索引擎数据库、官方信息发布平台的后台数据库以及个人信息发布平台的后台数据库中的一项或者多项,对此并不进行限制。优选的,可以根据目标事件的类型,选取相对应的网络数据库,例如,如果目标事件的类型为金融类事件,则选取金融类的网络数据库。
[0042]在本实施例中,网络数据库中的内容均包括时间标签,因此,当确定出待测语句在网络数据库中的哪些内容中出现后,可以同时得到该待测语句的出现时间,相应的,可以选取一个设定的时间单位,例如,天、星期或者月等。之后观察不同时间下,各
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1