基于人工智能的数据调整方法、装置、电子设备及介质与流程

文档序号:31069430发布日期:2022-08-09 20:52阅读:70来源:国知局
基于人工智能的数据调整方法、装置、电子设备及介质与流程

1.本技术涉及人工智能技术领域,具体涉及一种基于人工智能的数据调整方法、装置、电子设备及介质。


背景技术:

2.在大数据时代,随着企业的业务内容、数据量逐步走向多元化、大量化,企业所关注的业务指标也开始变得异常的庞杂,这就使得保证指标数据的准确性成为一项艰巨的任务。业务内容和政策经常发生变动,且指标数据需要随着业务内容以及政策等进行自动调整。
3.但是,指标数据无法很好地实现随业务内容及政策进行自动调整,所以导致指标数据的调整效率差,确定的指标数据不准。


技术实现要素:

4.鉴于以上内容,有必要提出一种基于人工智能的数据调整方法、装置、电子设备及介质,通过目标事件自动调整指标数据,提高指标数据的调整效率。
5.第一方面,本技术提供了一种基于人工智能的数据调整方法,所述方法包括:
6.基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件;
7.基于预先定义的事项标识,在所述目标事件中抽取与所述事项标识相应的词汇向量和句子向量;
8.将所述词汇向量与所述句子向量进行融合,得到融合向量;
9.将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;
10.获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期;
11.在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据;
12.根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
13.根据本技术的一个可选的实施方式,所述基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件包括:
14.基于预设的时间间隔,获取在目标时间段内出现的事件,并为所述目标期限内的事件生成血缘关系图;
15.基于预先确定的识别事件,在所述血缘关系图中确定第一事件;
16.将所述血缘关系图中与所述第一事件存在血缘关系的事件确定为第二事件;
17.将所述第一事件和所述第二事件,确定为目标事件。
18.根据本技术的一个可选的实施方式,所述在所述目标事件中抽取与所述事项标识相应的词汇向量包括:
19.对所述目标事件内容进行分词处理,得到多个分词;
20.获取分词与分词之间的连接度及获取连接度小于或者等于预设连接度阈值的目标连接度;
21.以分词为节点,在目标连接度对应的两个分词之间建立无向边,得到无向网络结构图;
22.计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点;
23.将所述目标节点对应的字词作为关键词并获取所述关键词的词汇向量。
24.根据本技术的一个可选的实施方式,所述计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点包括:
25.计算每个节点的第一中心度和第二中心度;
26.将所述每个节点的第一中心度与第二中心度进行加权和计算,得到所述每个节点的网络特征值;
27.根据所述网络特征值的大小依次对所述节点进行降序排序;
28.根据降序排序的结果,获取前k个节点作为目标节点。
29.根据本技术的一个可选的实施方式,所述计算每个节点的第一中心度包括:
30.获取与所述节点通过无向边连接的其他节点;
31.获取所述其他节点的第一数量;
32.将所述第一数量确定为所述节点的第一中心度。
33.根据本技术的一个可选的实施方式,所述计算每个节点的第二中心度包括:
34.获取除所述节点之外的任一两个节点之间的最短路径结合;
35.当所述最短路径结合中包括所述节点时,则记录一次预设第一值;
36.当所述最短路径结合中不包括所述节点时,则记录一次预设第二值;
37.计算所述预设第一值与所述预设第二值的和值;
38.确定所述和值为所述节点的第二中心度。
39.根据本技术的一个可选的实施方式,所述根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据包括:
40.确定所述第二指标数据中历史日期对应的指标数据与所述历史日期对应的历史完成数据的数据差值;
41.将所述第二指标数据中历史日期对应的指标数据替换为所述历史日期对应的历史完成数据;
42.基于所述数据差值,调整所述第二指标数据中非历史日期对应的指标数据,得到第三指标数据。
43.第二方面,本技术提供了一种基于人工智能的数据调整装置,所述装置包括:
44.事件确定模块,用于基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件;
45.向量抽取模块,用于基于预先定义的事项标识,在所述目标事件中抽取所述事项标识相应的词汇向量和句子向量;
46.向量融合模块,用于将所述词汇向量与所述句子向量进行融合,得到融合向量;
47.影响计算模块,用于将所述融合向量输入预先训练的影响计算模型,得到所述目
标事件对应的影响值;
48.数据处理模块,用于获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期;
49.日期确定模块,用于在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据;
50.数据调整模块,用于根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
51.第三方面,本技术提供了一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述基于人工智能的数据调整方法。
52.第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的数据调整方法。
53.综上所述,本技术所述的基于人工智能的数据调整方法、装置、电子设备及介质,通过每隔预设的时间间隔,获取在目标时间段内出现的事件,并在获取到的事件中确定会影响指标数据的目标事件,基于预先定义的事项标识,对目标事件进行事件抽取,抽取目标事件中的词汇向量和句子向量,得到融合向量,融合向量中包含了目标事件对应的主要干扰事项,将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;基于确定的影响值调整预先设置的第一指标数据,得到第二指标数据,所述第二指标数据中包括多个日期;接着基于所述第二指标数据中每个数据对应的日期,在所述第二指标数据中确定历史完成数据;并根据所述历史完成数据对所述第二指标数据进行第二次调整,得到第三指标数据,本方案能够基于目标事件自动调整指标数据,提高指标数据的调整效率。
附图说明
54.图1是本技术实施例一提供的基于人工智能的数据调整方法的流程图。
55.图2是本技术实施例二提供的基于人工智能的数据调整装置的结构图。
56.图3是本技术实施例三提供的电子设备的结构示意图。
具体实施方式
57.为了能够更清楚地理解本技术的上述目的、特征和优点,下面结合附图和具体实施例对本技术进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
58.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本技术。
59.本技术实施例提供的基于人工智能的数据调整方法由电子设备执行,相应地,基于人工智能的数据调整装置运行于电子设备中。所述电子设备可以包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等。
60.本技术实施例可以基于人工智能技术对数据进行调整,提高数据调整的效率。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
61.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
62.实施例一
63.图1是本技术实施例一提供的基于人工智能的数据调整方法的流程图。所述基于人工智能的数据调整方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
64.s11,基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件。
65.基于预设的时间间隔,获取在目标时间内发生的事件,并在获取到的事件中确定与指标数据相关的目标事件,例如可以基于埋点获取在目标时间内发生的事件或者通过网络爬虫的方式获取目标时间内发生的事件。事件内容可以包括但不限于:事件网页,事件文本,事件图片,事件视频等以结构化或者非结构化形式存在的信息。所述预设的时间间隔可以是3小时或者6小时或24小时,在此不做任何限定。目标时间可以是两次确定目标事件之间间隔的时间,例如,时间间隔为3小时,上一次确定目标事件的时间为9:00,这一次确定目标事件的时间为12:00,这一次确定目标事件是在9:00-12:00这段时间内发生的事情中进行确认的。所述目标事件会影响指标数据,例如政策调整相关事情、放假调整相关事情、市场变化相关事情等,指标数据为指导用户进行作业的数据。
66.在一个可选的实施方式中,所述基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件包括:
67.基于预设的时间间隔,获取在目标时间段内出现的事件,并为所述目标期限内的事件生成血缘关系图;
68.基于预先确定的识别事件,在所述血缘关系图中确定第一事件;
69.将所述血缘关系图中与所述第一事件存在血缘关系的事件确定为第二事件;
70.将所述第一事件和所述第二事件,确定为目标事件。
71.可以基于语义识别,提取在目标时间段内出现的事件中每个事件对应的关键词,基于预先设置的血缘流向表,确定所述关键词之间的关联,所述血缘流向表中记录了所述关键性之间的关联关系,例如,关键词a与关键词b、关键词c连接,关键词b与关键词a、关键词e连接,关键词c与关键词a、关键词f连接。基于所述关键词之间的关联,构建血缘关系图。例如,在构建好的血缘关系图中,关键词a对应的事件与关键词b对应的事件、关键词c对应的事件连接,关键词b对应的事件与关键词a对应的事件、关键词e对应的事件连接,关键词c对应的事件与关键词a对应的事件、关键词f对应的事件连接。
72.识别事件为影响指标数据的事件,可以基于大数据分析预先确定识别事件。可以将血缘关系图中与预先确定的识别事件相同的事件,确定为第一事件,或者可以将血缘关系图中与预先确定的识别事件的差异值小于预设阈值的事件确定为第一事件。
73.确定第一事件后,查询所述血缘关系图中,将与所述第一事件存在血缘的事件确定为第二事件,即将与所述第一事件存在血缘的事件确定为第二事件。
74.基于血缘关系图可以确定更多的目标事件,从而提高调整指标数据的效率。
75.s12,基于预先定义的事项标识,在所述目标事件中抽取与所述事项标识相应的词汇向量和句子向量。
76.事先定义多个待抽取的事项标识,例如:时间、事件名称、事件经过。从目标事件内容中抽取出每一个事项标识的属性值,例如,时间范围,性质等,性质可以包括延期、放假等等。
77.应当理解的是,对于目标事件视频,则先抽取多个目标事件视频帧,再从多个目标事件视频帧中识别出文本信息,得到目标事件内容。
78.可以利用word2vec抽取词汇向量,word2vec是指利用浅层神经网络自动学习词语在语料库中的出现情况,把词语嵌入到一个高维的空间中,在新的高维空间中词语被表示为词向量的形式。
79.在一个可选的实施方式中,所述在所述目标事件中抽取与所述事项标识相应的词汇向量包括:
80.对所述目标事件内容进行分词处理,得到多个分词;
81.获取分词与分词之间的连接度及获取连接度小于或者等于预设连接度阈值的目标连接度;
82.以分词为节点,在目标连接度对应的两个分词之间建立无向边,得到无向网络结构图;
83.计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点;
84.将所述目标节点对应的字词作为关键词并获取所述关键词的词汇向量。
85.其中,预设连接度阈值可以为2或者3。
86.分词与分词之间的连接度是指分词与分词在整篇目标事件内容中所处位置的跨度。例如,分词a出现在第一个位置,分词b出现在第二个位置,分词c出现在第三个位置,则分词a与分词b之间的连接度为1,分词b与分词c之间的连接度为1,分词a与分词c之间的连接度为2。
87.连接度为1,表明两个节点之间是紧邻的关系。而在建立无向网络结构图中,如果仅仅在两个紧邻的节点之间建立无向边,可能会丢失与其他节点之间的关联关系,同时提高了某些无用词在无向网络结构图中的重要性,本实施方式通过预先设置连接度阈值来确定目标连接度,从而以分词为节点,在目标连接度对应的两个分词之间建立无向边,得到无向网络结构图,进而确保词在句子中的关联跨度,既能保证词与其他词之间的关联关系,又不会产生无用词,提高了关键词的抽取准确度。
88.在一个可选的实施方式中,所述计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点包括:
89.计算每个节点的第一中心度和第二中心度;
90.将所述每个节点的第一中心度与第二中心度进行加权和计算,得到所述每个节点的网络特征值;
91.根据所述网络特征值的大小依次对所述节点进行降序排序;
92.根据降序排序的结果,获取前k个节点作为目标节点。
93.将单个目标事件内容构建一个语义复杂的无向网络结构图,将第一中心度与第二中心度相结合,计算网络特征值并提取关键词,能够提高抽取关键词的准确度。第一中心度体现了分词在目标事件内容中的局部作用,而第二中心度体现了分词在目标事件要素中的整体作用,通过第一中心度和第二中心度的加权计算,得到的网络特征值将在第一中心度和第二中心度共同作用,既能体现分词的局部特征,又能体现整体特征,使得高频分词和处于整个无向网络结构图中的核心位置处的低频分词都能得以体现。根据网络特征值的大小按照从大到小的顺序,对节点进行降序排序。根据降序排序的结果,选取k个网络特征值较大的节点作为目标节点,其中,k值的大小可以根据实际情况进行设置,在此不做任何限定。
94.在一个可选的实施方式中,所述计算每个节点的第一中心度包括:
95.获取与所述节点通过无向边连接的其他节点;
96.获取所述其他节点的第一数量;
97.将所述第一数量确定为所述节点的第一中心度。
98.如果某个节点的第一中心度较大,则表明与该节点直接相连的其他节点的个数较多,该节点与其他节点关联紧密,具有较强的局部关键性。如果某个节点的第一中心度较小,则表明与该节点直接相连的其他节点的个数较少,该节点与其他节点关联松散,具有较弱的局部关键性。
99.在一个可选的实施方式中,所述计算每个节点的第二中心度包括:
100.获取除所述节点之外的任一两个节点之间的最短路径结合;
101.当所述最短路径结合中包括所述节点时,则记录一次预设第一值;
102.当所述最短路径结合中不包括所述节点时,则记录一次预设第二值;
103.计算所述预设第一值与所述预设第二值的和值;
104.确定所述和值为所述节点的第二中心度。
105.如果无向网络结构图中的两个节点通过一些无向边连接,则这两个节点是可达的,并把连接这两个节点的路径中变数最少的路径称之为最短路径。
106.即使某个节点的第一中心度较大,但该节点也有可能是无向网络结构图中的边缘节点,而非中心节点,因此,通过计算节点的第二中心度,能够确定该节点是否为无向网络结构图中的中心节点。第二中心度越大,表明该节点越处于许多其他节点对的最短路径上,该节点具有较高的中心作用。第二中心度进一步体现了词汇在整个目标事件内容中的关键作用。
107.s13,将所述词汇向量与所述句子向量进行融合,得到融合向量。
108.本实施例中,从所述目标事件内容中抽取与所述事项标识相应的句子向量,并将所述词汇向量与所述句子向量进行融合,得到的融合向量进一步增强了向量的特征表达能力,融合向量中包含了目标事件对应的主要干扰事项。
109.s14,将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值。
110.所述影响计算模型可以是基于深度学习构建的模型,模型的输入为目标事件对应的融合向量,输出为所述目标事件对应的影响值,影响值用于表示该目标事件对指标数据
的影响,包括负影响和正影响。例如,影响值为0-1之间的数值时,对指标数据的影响为负影响;例如,影响值为大于1的数值时,对指标数据的影响为正影响。若存在多个目标事件,可以计算每个目标事件对应的影响值,将所述多个目标事件对应的影响值的和,确定为目标事件对应的影响值。
111.s15,获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期。
112.第一指标数据为预先设置的指导作业的数据。所述第一指标数据中包括多个日期对应的指标数据,例如,所述第一指标数据可以为一个月内每天对应的指标数据。
113.可以将第一指标数据中每个日期对应的指标数据乘以所述影响值进行加权处理,得到在目标事件影响下的实际指标数据。基于所述实际指标数据,得到第二指标数据,所述第二指标数据中包括多个日期。若影响值为大于1的数值时,第二指标数据的值大于第一指标数据的值;若影响值为0-1之间的数值时,第二指标数据的值小于或等于第一指标数据的值。
114.s16,在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据。
115.历史日期为相对于目前日期之前的日期。例如目前日期为6月6号,该第二指标数据中6月6号之前的日期为历史日期。获取每个历史日期对应的历史完成数据,历史完成数据为该指标数据对应的目标用户在每个历史日期中完成任务的相关数据。
116.s17,根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
117.在一个可选的实施方式中,所述根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据包括:
118.确定所述第二指标数据中历史日期对应的指标数据与所述历史日期对应的历史完成数据的数据差值;
119.将所述第二指标数据中历史日期对应的指标数据替换为所述历史日期对应的历史完成数据;
120.基于所述数据差值,调整所述第二指标数据中非历史日期对应的指标数据,得到第三指标数据。
121.计算第二指标数据中历史日期对应的指标数据(目标用户应该在历史日期目标要完成的任务数据)与所述历史日期对应的历史完成数据(目标用户应该在历史日期实际完成的任务数据)之间的数据差值。若有存在多个历史日期,计算第二指标数据中每个历史日期对应的指标数据与历史完成数据之前的差值,将所述多个历史日期对应的差值之和,确定为数据差值。
122.可以确定所述第二指标数据中非历史日期对应的日期天数,用所述数据差值除以所述日期天数得到的值,调整所述第二指标数据中非历史日期对应的指标数据,得到第三指标数据。例如,第二指标数据中非历史日期对应的日期天数为20天,数据差值为-40,用所述数据差值除以所述日期天数得到的值(-2),调整所述第二指标数据中非历史日期对应的指标数据(将第二指标数据中每个非历史日期对应的指标数据加2),得到第三指标数据。
123.本技术所述的基于人工智能的数据调整方法,通过每隔预设的时间间隔,获取在目标时间段内出现的事件,并在获取到的事件中确定会影响指标数据的目标事件,基于预
先定义的事项标识,对目标事件进行事件抽取,抽取目标事件中的词汇向量和句子向量,得到融合向量,融合向量中包含了目标事件对应的主要干扰事项,将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;基于确定的影响值调整预先设置的第一指标数据,得到第二指标数据,所述第二指标数据中包括多个日期;接着基于所述第二指标数据中每个数据对应的日期,在所述第二指标数据中确定历史完成数据;并根据所述历史完成数据对所述第二指标数据进行第二次调整,得到第三指标数据,本方案能够基于目标事件自动调整指标数据,提高指标数据的调整效率。
124.实施例二
125.图2是本技术实施例二提供的基于人工智能的数据调整装置的结构图。
126.在一些实施例中,所述基于人工智能的数据调整装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的数据调整装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的数据调整方法的功能。
127.本实施例中,所述基于人工智能的数据调整装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:事件确定模块201、向量抽取模块202、向量融合模块203、影响计算模块204、数据处理模块205、日期确定模块206及数据调整模块207。本技术所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
128.事件确定模块201,用于基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件。
129.基于预设的时间间隔,获取在目标时间内发生的事件,并在获取到的事件中确定与指标数据相关的目标事件,例如可以基于埋点获取在目标时间内发生的事件或者通过网络爬虫的方式获取目标时间内发生的事件。事件内容可以包括但不限于:事件网页,事件文本,事件图片,事件视频等以结构化或者非结构化形式存在的信息。所述预设的时间间隔可以是3小时或者6小时或24小时,在此不做任何限定。目标时间可以是两次确定目标事件之间间隔的时间,例如,时间间隔为3小时,上一次确定目标事件的时间为9:00,这一次确定目标事件的时间为12:00,这一次确定目标事件是在9:00-12:00这段时间内发生的事情中进行确认的。所述目标事件会影响指标数据,例如政策调整相关事情、放假调整相关事情、市场变化相关事情等,指标数据为指导用户进行作业的数据。
130.在一个可选的实施方式中,事件确定模块201基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件包括:
131.基于预设的时间间隔,获取在目标时间段内出现的事件,并为所述目标期限内的事件生成血缘关系图;
132.基于预先确定的识别事件,在所述血缘关系图中确定第一事件;
133.将所述血缘关系图中与所述第一事件存在血缘关系的事件确定为第二事件;
134.将所述第一事件和所述第二事件,确定为目标事件。
135.可以基于语义识别,提取在目标时间段内出现的事件中每个事件对应的关键词,基于预先设置的血缘流向表,确定所述关键词之间的关联,所述血缘流向表中记录了所述
关键性之间的关联关系,例如,关键词a与关键词b、关键词c连接,关键词b与关键词a、关键词e连接,关键词c与关键词a、关键词f连接。基于所述关键词之间的关联,构建血缘关系图。例如,在构建好的血缘关系图中,关键词a对应的事件与关键词b对应的事件、关键词c对应的事件连接,关键词b对应的事件与关键词a对应的事件、关键词e对应的事件连接,关键词c对应的事件与关键词a对应的事件、关键词f对应的事件连接。
136.识别事件为影响指标数据的事件,可以基于大数据分析预先确定识别事件。可以将血缘关系图中与预先确定的识别事件相同的事件,确定为第一事件,或者可以将血缘关系图中与预先确定的识别事件的差异值小于预设阈值的事件确定为第一事件。
137.确定第一事件后,查询所述血缘关系图中,将与所述第一事件存在血缘的事件确定为第二事件,即将与所述第一事件存在血缘的事件确定为第二事件。
138.基于血缘关系图可以确定更多的目标事件,从而提高调整指标数据的效率。
139.向量抽取模块202,用于基于预先定义的事项标识,在所述目标事件中抽取与所述事项标识相应的词汇向量和句子向量。
140.事先定义多个待抽取的事项标识,例如:时间、事件名称、事件经过。从目标事件内容中抽取出每一个事项标识的属性值,例如,时间范围,性质等,性质可以包括延期、放假等等。
141.应当理解的是,对于目标事件视频,则先抽取多个目标事件视频帧,再从多个目标事件视频帧中识别出文本信息,得到目标事件内容。
142.可以利用word2vec抽取词汇向量,word2vec是指利用浅层神经网络自动学习词语在语料库中的出现情况,把词语嵌入到一个高维的空间中,在新的高维空间中词语被表示为词向量的形式。
143.在一个可选的实施方式中,向量抽取模块202在所述目标事件中抽取与所述事项标识相应的词汇向量包括:
144.对所述目标事件内容进行分词处理,得到多个分词;
145.获取分词与分词之间的连接度及获取连接度小于或者等于预设连接度阈值的目标连接度;
146.以分词为节点,在目标连接度对应的两个分词之间建立无向边,得到无向网络结构图;
147.计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点;
148.将所述目标节点对应的字词作为关键词并获取所述关键词的词汇向量。
149.其中,预设连接度阈值可以为2或者3。
150.分词与分词之间的连接度是指分词与分词在整篇目标事件内容中所处位置的跨度。例如,分词a出现在第一个位置,分词b出现在第二个位置,分词c出现在第三个位置,则分词a与分词b之间的连接度为1,分词b与分词c之间的连接度为1,分词a与分词c之间的连接度为2。
151.连接度为1,表明两个节点之间是紧邻的关系。而在建立无向网络结构图中,如果仅仅在两个紧邻的节点之间建立无向边,可能会丢失与其他节点之间的关联关系,同时提高了某些无用词在无向网络结构图中的重要性,本实施方式通过预先设置连接度阈值来确
定目标连接度,从而以分词为节点,在目标连接度对应的两个分词之间建立无向边,得到无向网络结构图,进而确保词在句子中的关联跨度,既能保证词与其他词之间的关联关系,又不会产生无用词,提高了关键词的抽取准确度。
152.在一个可选的实施方式中,向量抽取模块202计算所述无向网络结构图中每个节点的网络特征值并根据所述网络特征值筛选出目标节点包括:
153.计算每个节点的第一中心度和第二中心度;
154.将所述每个节点的第一中心度与第二中心度进行加权和计算,得到所述每个节点的网络特征值;
155.根据所述网络特征值的大小依次对所述节点进行降序排序;
156.根据降序排序的结果,获取前k个节点作为目标节点。
157.将单个目标事件内容构建一个语义复杂的无向网络结构图,将第一中心度与第二中心度相结合,计算网络特征值并提取关键词,能够提高抽取关键词的准确度。第一中心度体现了分词在目标事件内容中的局部作用,而第二中心度体现了分词在目标事件要素中的整体作用,通过第一中心度和第二中心度的加权计算,得到的网络特征值将在第一中心度和第二中心度共同作用,既能体现分词的局部特征,又能体现整体特征,使得高频分词和处于整个无向网络结构图中的核心位置处的低频分词都能得以体现。根据网络特征值的大小按照从大到小的顺序,对节点进行降序排序。根据降序排序的结果,选取k个网络特征值较大的节点作为目标节点,其中,k值的大小可以根据实际情况进行设置,在此不做任何限定。
158.在一个可选的实施方式中,向量抽取模块202计算每个节点的第一中心度包括:
159.获取与所述节点通过无向边连接的其他节点;
160.获取所述其他节点的第一数量;
161.将所述第一数量确定为所述节点的第一中心度。
162.如果某个节点的第一中心度较大,则表明与该节点直接相连的其他节点的个数较多,该节点与其他节点关联紧密,具有较强的局部关键性。如果某个节点的第一中心度较小,则表明与该节点直接相连的其他节点的个数较少,该节点与其他节点关联松散,具有较弱的局部关键性。
163.在一个可选的实施方式中,向量抽取模块202计算每个节点的第二中心度包括:
164.获取除所述节点之外的任一两个节点之间的最短路径结合;
165.当所述最短路径结合中包括所述节点时,则记录一次预设第一值;
166.当所述最短路径结合中不包括所述节点时,则记录一次预设第二值;
167.计算所述预设第一值与所述预设第二值的和值;
168.确定所述和值为所述节点的第二中心度。
169.如果无向网络结构图中的两个节点通过一些无向边连接,则这两个节点是可达的,并把连接这两个节点的路径中变数最少的路径称之为最短路径。
170.即使某个节点的第一中心度较大,但该节点也有可能是无向网络结构图中的边缘节点,而非中心节点,因此,通过计算节点的第二中心度,能够确定该节点是否为无向网络结构图中的中心节点。第二中心度越大,表明该节点越处于许多其他节点对的最短路径上,该节点具有较高的中心作用。第二中心度进一步体现了词汇在整个目标事件内容中的关键作用。
171.向量融合模块203,用于将所述词汇向量与所述句子向量进行融合,得到融合向量。
172.本实施例中,从所述目标事件内容中抽取与所述事项标识相应的句子向量,并将所述词汇向量与所述句子向量进行融合,得到的融合向量进一步增强了向量的特征表达能力,融合向量中包含了目标事件对应的主要干扰事项。
173.影响计算模块204,用于将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值。
174.所述影响计算模型可以是基于深度学习构建的模型,模型的输入为目标事件对应的融合向量,输出为所述目标事件对应的影响值,影响值用于表示该目标事件对指标数据的影响,包括负影响和正影响。例如,影响值为0-1之间的数值时,对指标数据的影响为负影响;例如,影响值为大于1的数值时,对指标数据的影响为正影响。若存在多个目标事件,可以计算每个目标事件对应的影响值,将所述多个目标事件对应的影响值的和,确定为目标事件对应的影响值。
175.数据处理模块205,用于获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期。
176.第一指标数据为预先设置的指导作业的数据。所述第一指标数据中包括多个日期对应的指标数据,例如,所述第一指标数据可以为一个月内每天对应的指标数据。
177.可以将第一指标数据中每个日期对应的指标数据乘以所述影响值进行加权处理,得到在目标事件影响下的实际指标数据。基于所述实际指标数据,得到第二指标数据,所述第二指标数据中包括多个日期。若影响值为大于1的数值时,第二指标数据的值大于第一指标数据的值;若影响值为0-1之间的数值时,第二指标数据的值小于或等于第一指标数据的值。
178.日期确定模块206,用于在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据。
179.历史日期为相对于目前日期之前的日期。例如目前日期为6月6号,该第二指标数据中6月6号之前的日期为历史日期。获取每个历史日期对应的历史完成数据,历史完成数据为该指标数据对应的目标用户在每个历史日期中完成任务的相关数据。
180.数据调整模块207,用于根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
181.第三指标数据为调整好的指标数据。
182.在一个可选的实施方式中,数据调整模块207根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据包括:
183.确定所述第二指标数据中历史日期对应的指标数据与所述历史日期对应的历史完成数据的数据差值;
184.将所述第二指标数据中历史日期对应的指标数据替换为所述历史日期对应的历史完成数据;
185.基于所述数据差值,调整所述第二指标数据中非历史日期对应的指标数据,得到第三指标数据。
186.计算第二指标数据中历史日期对应的指标数据(目标用户应该在历史日期目标要
完成的任务数据)与所述历史日期对应的历史完成数据(目标用户应该在历史日期实际完成的任务数据)之间的数据差值。若有存在多个历史日期,计算第二指标数据中每个历史日期对应的指标数据与历史完成数据之前的差值,将所述多个历史日期对应的差值之和,确定为数据差值。
187.可以确定所述第二指标数据中非历史日期对应的日期天数,用所述数据差值除以所述日期天数得到的值,调整所述第二指标数据中非历史日期对应的指标数据,得到第三指标数据。例如,第二指标数据中非历史日期对应的日期天数为20天,数据差值为-40,用所述数据差值除以所述日期天数得到的值(-2),调整所述第二指标数据中非历史日期对应的指标数据(将第二指标数据中每个非历史日期对应的指标数据加2),得到第三指标数据。
188.本技术所述的基于人工智能的数据调整装置,通过每隔预设的时间间隔,获取在目标时间段内出现的事件,并在获取到的事件中确定会影响指标数据的目标事件,基于预先定义的事项标识,对目标事件进行事件抽取,抽取目标事件中的词汇向量和句子向量,得到融合向量,融合向量中包含了目标事件对应的主要干扰事项,将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;基于确定的影响值调整预先设置的第一指标数据,得到第二指标数据,所述第二指标数据中包括多个日期;接着基于所述第二指标数据中每个数据对应的日期,在所述第二指标数据中确定历史完成数据;并根据所述历史完成数据对所述第二指标数据进行第二次调整,得到第三指标数据,本方案能够基于目标事件自动调整指标数据,提高指标数据的调整效率。
189.实施例三
190.本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的数据调整方法实施例中的步骤,例如图1所示的s11-s17:
191.s11,基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件;
192.s12,基于预先定义的事项标识,在所述目标事件中抽取与所述事项标识相应的词汇向量和句子向量;
193.s13,将所述词汇向量与所述句子向量进行融合,得到融合向量;
194.s14,将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;
195.s15,获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期;
196.s16,在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据;
197.s17,根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
198.或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-207:
199.事件确定模块201,用于基于预设的时间间隔,在目标时间段内出现的事件中确定目标事件;
200.向量抽取模块202,用于基于预先定义的事项标识,在所述目标事件中抽取与所述事项标识相应的词汇向量和句子向量;
201.向量融合模块203,用于将所述词汇向量与所述句子向量进行融合,得到融合向量;
202.影响计算模块204,用于将所述融合向量输入预先训练的影响计算模型,得到所述目标事件对应的影响值;
203.数据处理模块205,用于获取预先设置的第一指标数据,并基于所述影响值,对所述第一指标数据进行加权处理,得到第二指标数据,所述第二指标数据中包括多个日期;
204.日期确定模块206,用于在所述多个日期中,确定历史日期,并获取所述历史日期对应的历史完成数据;
205.数据调整模块207,用于根据所述历史完成数据对所述第二指标数据进行调整,得到第三指标数据。
206.实施例四
207.参阅图3所示,为本技术实施例三提供的电子设备的结构示意图。在本技术较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、收发器33及至少一条通信总线34。
208.本领域技术人员应该了解,图3示出的电子设备的结构并不构成本技术实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
209.在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
210.需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本技术,也应包含在本技术的保护范围以内,并以引用方式包含于此。
211.在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的数据调整方法中的全部或者部分步骤。所述存储器31包括只读存储器(read-only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子擦除式可复写只读存储器(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
212.进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
213.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验
证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
214.在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(control unit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本技术实施例中所述的基于人工智能的数据调整方法的全部或者部分步骤;或者实现基于人工智能的数据调整装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
215.在一些实施例中,所述至少一条通信总线34被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
216.尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
217.上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的部分。
218.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
219.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
220.另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
221.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其他的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并
不表示任何特定的顺序。
222.最后应说明的是,以上实施例仅用以说明本技术的技术方案而非限制,尽管参照较佳实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,可以对本技术的技术方案进行修改或等同替换,而不脱离本技术技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1