数据处理方法及设备与流程

文档序号:24737848发布日期:2021-04-20 20:31阅读:107来源:国知局
数据处理方法及设备与流程

1.本申请涉及数据处理技术,具体涉及一种数据处理方法及设备。


背景技术:

2.对于通信双方产生的对话数据,在某些应用场景中,需要将对话数据进行保存,以便后续作为证据进行使用。相关技术中,不会考虑到对话数据本身所涉及的内容,均将对话数据保存到指定的存储单元中。这种对对话数据的保存方式较为粗糙且不方便后续查找。


技术实现要素:

3.为解决现有存在的技术问题,本申请实施例提供一种数据处理方法及设备。
4.本申请实施例的技术方案是这样实现的:
5.本申请实施例提供一种数据处理方法,包括:
6.获得对话数据;
7.识别对话数据的内容;
8.判断对话内容中是否出现第一预定事件,其中所述第一预定事件表征所述对话内容由第一内容转移到第二内容;其中,第一内容为针对第一事件的内容,第二内容为针对第二事件的内容;
9.在判断为出现有第一预定事件的情况下,将所述对话数据与第二事件进行关联记录。
10.前述方案中,所述识别对话数据的内容,包括:
11.识别对话数据中的目标数据,其中所述目标数据为对话数据中表征主题和/或主体的数据;
12.在对话数据中出现有两个不同目标数据的情况下,判断对话内容中出现有第一预定事件。
13.前述方案中,在判断为出现有第一预定事件的情况下,所述方法还包括:
14.对所述对话数据中表征主题和/或主体的数据进行识别;
15.依据识别结果,从对话数据中确定出对应于第二内容的数据;
16.相应的,所述将所述对话数据与第二事件进行关联记录,包括:
17.将确定出的所述数据与第二事件进行关联记录。
18.前述方案中,所述对所述对话数据中表征主题和/或主体的数据进行识别;依据识别结果,从对话数据中确定出对应于第二内容的数据,包括:
19.识别所述对话数据中出现的第一数据,所述第一数据表征第二事件的主题和/或主体;
20.对所述对话数据中位于所述第一数据之后的数据进行识别;
21.确定所述对话数据中位于所述第一数据之后的数据中是否出现有第二数据,所述第二数据表征主题和/或主体、且第二数据表征的主题和/或主体与第二事件的主题和/或
主体不同;
22.确定为是的情况下,获得所述对话数据中位于第一数据和第二数据之间的数据,并将其作为所述对话数据中对应于第二内容的数据。
23.前述方案中,在所述确定为是的情况下,所述方法还包括:
24.确定所述对话数据的第一数据和第二数据之间是否存在有针对第二内容的缺省数据;
25.在确定为存在缺省数据的情况下,确定所述缺省数据在第一数据和第二数据之间的添加位置;
26.将所述缺省数据添加到所述位置上;
27.将添加有所述缺省数据后所述第一数据和第二数据之间的数据作为对应于第二内容的数据。
28.前述方案中,在识别对话数据的内容之前,所述方法还包括:
29.确定是否存在有针对第一事件的未处理数据和针对第二事件的未处理数据;
30.确定为存在的情况下,确定针对第一事件的未处理数据和针对第二事件的未处理数据是否能够合并处理;
31.确定为不能合并处理的情况下,识别对话数据的内容。
32.前述方案中,在判断为出现有第一预定事件的情况下,所述方法还包括:
33.识别第二内容的对话意图,得到识别结果;
34.在所述识别结果表征为所述第二内容的对话意图为预定意图的情况下,将所述对话数据与所述第二事件进行关联记录;
35.在所述识别结果表征为所述第二内容的对话意图为非预定意图的情况下,标识所述第一事件和第二事件之间的关联性。
36.前述方案中,在判断为出现第一预定事件的情况下,所述方法还包括:
37.获得产生所述对话数据的通信双方中至少一方的权限信息;
38.根据所述权限信息,确定是否将所述对话数据与第二事件进行关联记录。
39.前述方案中,所述根据所述权限信息,确定是否将所述对话数据与第二事件进行关联记录,包括:
40.在所述通信双方的权限信息表征为所述通信双方均可访问所述第二事件的情况下,将所述对话数据与第二事件进行关联记录;
41.在所述通信双方存在有至少一方无法访问所述第二事件的情况下,获得无法访问所述第二事件的通信方的角色信息;依据角色信息,确定是否将所述对话数据与第二事件进行关联记录。
42.本申请实施例还提供一种数据处理设备,包括:
43.获得单元,用于获得对话数据;
44.识别单元,用于识别对话数据的内容;
45.判断单元,用于判断对话内容中是否出现第一预定事件,其中所述第一预定事件表征所述对话内容由第一内容转移到第二内容;其中,第一内容为针对第一事件的内容,第二内容为针对第二事件的内容;
46.记录单元,用于在判断单元判断为出现有第一预定事件的情况下,将所述对话数
据与第二事件进行关联记录。
47.本申请实施例提供一种数据处理方法及设备,其中,所述方法包括:获得对话数据;识别对话数据的内容;判断对话内容中是否出现第一预定事件,其中所述第一预定事件表征所述对话内容由第一内容转移到第二内容;其中,第一内容为针对第一事件的内容,第二内容为针对第二事件的内容;在判断为出现有第一预定事件的情况下,将所述对话数据与第二事件进行关联记录。
48.本申请实施例中,在对话数据中出现的第二内容所针对的事件可视为第一内容对针对的事件的转移事件,本申请实施例的技术方案相当于是一种将转移事件以及涉及到该转移事件的对话数据进行关联记录的技术方案,为一种有针对性的记录方案。相对于相关技术中不会考虑对话数据本身涉及的内容仅对对话数据进行保存的方案相比,这种记录方案更为细腻,不会由于对话数据涉及到两个或多个事件的内容而造成的对转移事件的对话数据的漏记录。将涉及到某个事件的对话数据与该事件进行关联记录,也可方便后续对与该事件相关的可作为证据的对话数据的查找。
附图说明
49.为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
50.图1为本申请实施例中数据处理方法的实现流程示意图一;
51.图2为本申请实施例中数据处理方法的实现流程示意图二;
52.图3为本申请实施例中数据处理方法的实现流程示意图三;
53.图4为本申请实施例中数据处理方法的实现流程示意图四;
54.图5为本申请实施例中数据处理方法的实现流程示意图五;
55.图6为本申请实施例中数据处理方法的实现流程示意图六;
56.图7为本申请实施例中判断是否需要将对话数据与第二事件进行关联记录的方法实现示意图;
57.图8为本申请实施例中确定对话数据中需要与第二事件进行关联记录的数据的方法实现示意图;
58.图9为本申请实施例中数据处理设备的构成示意图一;
59.图10为本申请实施例中数据处理设备的构成示意图二。
具体实施方式
60.为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程
图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
61.本申请实施例提供一种数据处理方法,应用于数据处理设备中。如图1所示,所述方法包括:
62.s101:获得对话数据;
63.s102:识别对话数据的内容;
64.s101~s102中,监控对话数据,在监控到出现有对话数据的情况下,识别对话数据所涉及的内容,即识别对话内容谈论是何种事情。其中,对话数据可以是基于通过双方的数据交互而产生,还可以是基于通信多方(三方或三方以上)的数据交互而产生。对话数据可以是基于通信双方或多方的音频交互而产生,也可以是基于通信双方或多方的文本交互而产生。即对话数据可以是由于通信双方或多方通过互相说话而产生的,也可以是通信双方或多方通过对话框对对方输入文字内容而产生。考虑到识别文本内容的准确性更高,在对话数据为音频数据的情况下,需要将音频数据转换成文本数据,再基于转换后的文本数据,对对话涉及的内容进行识别。可以理解,本申请实例中的对话数据是通信双方或多方基于自然语言的交流方式而产生,可以较为正式,也可以较为口语化。
65.s103:判断对话内容中是否出现第一预定事件,其中所述第一预定事件表征所述对话内容由第一内容转移到第二内容;其中,第一内容为针对第一事件的内容,第二内容为针对第二事件的内容;
66.s104:在判断为出现有第一预定事件的情况下,将所述对话数据与第二事件进行关联记录。
67.s103~s104中,判断对话内容是否从谈论一个事件转移到谈论另一事件,如果是,即判断为对话内容是通信双方或多方从谈论针对第一事件的(第一)内容转移到谈论针对第二事件的(第二)内容的情况下,那么将对话数据与第二事件进行关联记录。如果称第一事件为原事件,第二事件为相对于原事件的转移事件,那么利用本申请实施例的技术方案,考虑了对话数据所涉及的内容,在识别出对话内容从谈论一个事件转移到谈论另一事件的情况下,能够将先涉及到原事件后又涉及到转移事件的对话数据和该转移事件进行关联记录,相当于是一种将转移事件以及涉及到该转移事件的对话数据进行关联记录的技术方案,为一种有针对性的记录方案。相对于相关技术中不会考虑对话数据本身涉及的内容仅对对话数据进行保存的方案相比,这种记录方案更为细腻,不会由于对话数据涉及到两个或多个事件的内容而造成的对转移事件的对话数据的漏记录。将涉及到某个事件的对话数据与该事件进行关联记录,也可方便后续对与该事件相关的(可作为证据的)对话数据的查找。
68.前述s104中是在判断为出现有第一预定事件的情况下,将对话数据与第二事件进行关联记录。也可以将对话数据与第一事件、第二事件分别进行关联记录。相当于将涉及到某个事件的对话数据与该事件进行关联记录,为一种对对话数据更为细腻的记录方式。也可方便后续对作为证据的对话数据的查找。
69.在一个可选的方案中,所述识别对话数据的内容,包括:
70.识别对话数据中的目标数据,其中所述目标数据为对话数据中表征主题和/或主体的数据;在对话数据中出现有两个不同目标数据的情况下,判断对话内容中出现有第一
预定事件。示例性地,表征为主题的数据可以诸如“协议”、“合同”、“合约”等数据;表征为主体的数据可以诸如“a公司”、“b单位”、“张三”、“李四”等数据。在同一对话数据中出现有表示为不同主题或不同主体的数据,则判断为对话内容由从谈论一个事件转移到谈论另一事件。这种依据对话数据中出现的目标数据判断对话内容中是否出现有第一预定事件的方案,简单易行,在工程上可方便实施。
71.前述s104还可以通过如下方案来实现:
72.s1041:在判断为出现有第一预定事件的情况下,对所述对话数据中表征主题和/或主体的数据进行识别;
73.s1042:依据识别结果,从对话数据中确定出对应于第二内容的数据;
74.s1043:将确定出的所述数据与第二事件进行关联记录。
75.s1041~s1043中,将对话数据中涉及到第二内容的数据提取出来,并将其与第二事件进行关联记录。此外,还可以将对话数据中涉及到第一内容的数据提取出来,并将其与第一事件进行关联记录。相当于,将整个对话数据中与某个事件有关的数据部分与该事件关联记录,无关的数据部分不需要关联记录,实现了针对性记录,也可保证记录的精确性。
76.在一个可选的方案中,前述方案中的所述对所述对话数据中表征主题和/或主体的数据进行识别,依据识别结果从对话数据中确定出对应于第二内容的数据的方案进一步可通过如下方案来实现,如图3所示:
77.s10411:识别所述对话数据中出现的第一数据,所述第一数据表征第二事件的主题和/或主体;
78.本申请实施例中的第一事件和第二事件为两个不同的事件。这两个事件的主题和/或主体可以不同。示例性地,第一事件为与a单位签订的合作协议,第二事件为与丁六签订的买卖办公物品的协议。s10411在于从通信双方或多方产生的对话数据中识别出表征第二事件的主题和/或主体的数据。通常认为在对话数据中从第一数据开始通信双方或多方开始就第二事件进行交流。
79.s10412:对所述对话数据中位于所述第一数据之后的数据进行识别;
80.s10413:确定所述对话数据中位于所述第一数据之后的数据中是否出现有第二数据,所述第二数据表征主题和/或主体、且第二数据表征的主题和/或主体与第二事件的主题和/或主体不同;
81.需要说明的是,第二数据表征的主题和/或主体可以为第一事件的主题和/或主体,还可以为在对话数据中产生为任何不同于第二事件的其它事件的主题和/或主体。
82.s10414:确定为是的情况下,获得所述对话数据中位于第一数据和第二数据之间的数据,并将其作为所述对话数据中对应于第二内容的数据。
83.在s10412~s10414中,相当于识别对话数据中位于第一数据之后的数据中是否出现有表征为(不同于第二事件的)其它事件的主题和/或主体数据,如果识别为是,则认为通信双方或多方在就第二事件进行交流之后还就其它事件进行了交流。对话数据中位于第一数据和第二数据之间的数据即可认为是通信双方或多方就第二事件进行交流的数据。其中,可认为第一数据是通信双方开始就第二事件进行交流的起始点,第二数据是交流结束点。
84.在s10411~s10414中,通过识别就第二事件进行交流的起始点和结束点来从通信
双方或多方的整个对话数据中识别出针对第二事件进行交流的数据,将这部分数据作为整个对话数据中对应于第二内容的数据。这种识别方案按照自然语言的输出特性而进行,可保证识别的准确性。
85.本申请实施例中,确定对话数据中位于第一数据之后的数据中出现有第二数据的情况下,如图4所示,所述方法还包括:
86.s401:确定所述对话数据中所述第一数据和第二数据之间是否存在有针对第二内容的缺省数据;
87.本步骤中,可对第一数据和第二数据之间存在的句子进行句子成分的分析,是否每个句子均存在主谓语或者主谓宾语成分。如果是,则认为不存在缺省数据。如果否,则认为存在缺省数据。比如对话数据中存在有诸如“与a单位签订的合作协议(第一事件)已经审核完成了,那么与b单位的呢?”,“那么与b单位的呢”意在询问“与b单位签订的合作协议(第二事件)是否也已经审核完成了?”,“那么与b单位的呢”这句话是存在缺省数据的。
88.s402:在确定为存在缺省数据的情况下,确定所述缺省数据在第一数据和第二数据之间的添加位置;
89.s403:将所述缺省数据添加到所述位置上;
90.s404:将添加有所述缺省数据后所述第一数据和第二数据之间的数据作为对应于第二内容的数据。
91.在s302~s304中,将存在缺省数据的句子中其缺少的句子(主谓宾)成分在句子中的位置即为缺省数据需要添加的位置,将缺省数据添加到该位置上,将添加有缺省数据后的所述第一数据和第二数据之间的数据作为对应于第二内容的数据。考虑到自然语言的特性,s301~s304所示的方案中将缺省数据添加到该添加的位置上,保证了句子含义的完整,更加明确了句子的含义内容。
92.在一个可选的方案中,在识别对话数据的内容之前,所述方法还包括:
93.确定是否存在有针对第一事件的未处理数据和针对第二事件的未处理数据;确定为存在的情况下,确定针对第一事件的未处理数据和针对第二事件的未处理数据是否能够合并处理;确定为不能合并处理的情况下,识别对话数据的内容。本可选方案中,在针对第一事件的未处理数据和针对第二事件的未处理数据能够合并处理的情况下将其进行合并处理。不能合并处理的情况下,对对话数据中是否由对第一事件的交流转移到对第二事件的交流进行识别。
94.在一个可选的方案中,在判断为出现有第一预定事件的情况下,所述方法还包括:识别第二内容的对话意图,得到识别结果;在所述识别结果表征为所述第二内容的对话意图为预定意图的情况下,将所述对话数据与所述第二事件进行关联记录;在所述识别结果表征为所述第二内容的对话意图为非预定意图的情况下,标识所述第一事件和第二事件之间的关联性。本可选方案中,是否对对话数据与第二事件进行关联记录,还需要根据第二内容的对话意图而定。如果对话中通信双方针对转移事件的交流较为正式,则视对话意图为预定意图,将对话数据与第二事件进行关联记录,以便后续作为证据进行查看。如果对话中通信双方针对转移事件的交流较为随意,则视对话意图为非预定意图,可不做关联记录,但也可将第一事件和第二事件进行关联性标识,以表明这两个事件在同一对话数据中均被提及到。
95.在一个可选的方案中,在判断为出现第一预定事件的情况下,所述方法还包括:获得产生所述对话数据的通信双方中至少一方的权限信息;根据所述权限信息,确定是否将所述对话数据与第二事件进行关联记录。以产生对话数据的通信方为通信双方为例,可根据通信双方中一方或两方的权限信息来确定是否将对话数据与第二事件进行关联记录。进一步的,在通信双方的权限信息表征为所述通信双方均可访问所述第二事件的情况下,将所述对话数据与第二事件进行关联记录;即通信双方均有访问第二事件的权限的情况下将对话数据与第二事件进行关联记录,以便后续对话数据作为证据使用。在通信双方存在有至少一方无法访问所述第二事件的情况下,获得无法访问所述第二事件的通信方的角色信息;依据角色信息,确定是否将对话数据与第二事件进行关联记录。即在一方或两方均不具有对第二事件的访问权项的情况下,依据该方的角色如属于通信中的主导方还是配合方来确定是否将对话数据与第二事件进行关联记录。这种记录方式尽量对可能作为证据使用的对话数据与第二事件进行关联记录,尽量避免由于无法作为证据使用的对话数据被记录而导致的记录空间占用大的问题。
96.下面结合附图5

8及具体实施例对本申请作进一步详细的说明。
97.在实际应用中,在公司内部,有些岗位人员通常存在大量的业务往来如法务人员和业务人员。其中,业务人员通过跑业务与a单位签订了程序授权合同,与b单位签订了购买办公用品的合同(采购合同)。这些合同需要提交到法务人员进行审批。且在审批的过程中业务人员和法务人员会存在一定的沟通交流,如对合同中的某项条款签订得是否得当进行沟通确认。法务人员和业务人员由于在公司岗位的不同,对于他们之间的沟通交流(对话)记录,存在有需要被保存或记录的情况,以便后续作为证据使用,以免后续就某个合同款项为何如此签订法务人员和业务人员双方均推卸责任。
98.本应用场景中,以数据处理设备应用于公司为例,在业务人员登录至数据处理设备时,使用其登录账号和密码进行登录。结合图5,在业务人员登录至数据处理设备时,基于业务人员输入的登录账号可获知其用户标识如用户在公司的工号。判断该业务人员已提交的合同文件是否存在有未被法务人员审批完的情况。
99.判断为均被法务人员审批完的情况下,如果业务人员与法务人员产生有对话数据,则对本次业务人员和法务人员产生的对话数据进行主题识别,并保存或记录主题词,待后续该业务人员提交合同文件的情况下,确定其提交的文件是否可与保存或记录的主题进行关联记录。
100.判断为存在有未被法务人员审批完的情况下,计算该业务人员提交的且未被法务人员审批完的合同文件的数量。
101.如果该数量为一个的情况下,对该业务人员和法务人员之间产生的对话数据进行监控,如果监控到产生对话数据,获得对话数据,继续执行如图6所示的流程。
102.如果该数量为两个或两个的情况下,识别这些未审批完的合同文件的主体以判断这些未审批完的合同文件是否是本公司与同一单位或公司签订的合同。如果这些未审批完的合同文件均是本公司与同一家单位或公司签订的合同,则可将这些合同文件合并为一个待审批文件,如果针对这个待审批文件法务人员与业务人员产生沟通交流,则需将沟通交流内容记录至这个待审批文件下。在技术层面上,将这些合同文件合并为一个待审批文件即为将这些合同文件放在同一文件下进行审批,并将沟通交流内容记录至这个文件下。如
果这些未审批完的合同文件不是与同一家单位或公司签订的,则需要判断这些合同文件是否形式相同如是否均是关于程序授权的文件或是否均是关于办公用品采购的合同,如果是,将将这些合同文件合并为一个待审批文件进行处理。如果不是,如果后续针对这些未审批完的合同文件业务人员与法务人员产生沟通交流,则需要获得他们之间产生的对话数据,继续执行如图6所示的流程。
103.本应用场景中,假定针对业务人员张三提交的两个合同文件:与a单位签订了程序授权合同和与b单位签订了购买办公用品的合同均未被审批完。且这两个合同无法合并处理,则关于这两个合同的审批,业务人员张三通过应用对话框向法务人员李四询问,产生如下对话数据:
104.张三:李四您好,我之前提交的两个合同文件何时能审批完?
105.李四:对于你提交的a单位签订的程序授权合同存在着问题,需要在问题核实之后再审批。
106.张三:存在着什么问题,我这边可以辅助解决吗?
107.李四:.....
108.张三:.....
109.…
110.张三:这下好了问题解决了,希望与a单位签订的程序授权合同尽快被审批完,那与b单位签订的购买办公用品的合同呢?
111.李四:

112.本应用场景中,数据处理设备对是否产生对话数据进行监控,当监控到对话数据时,对对话数据进行内容识别(s601)。基于识别出的对话内容,判断是否在询问第一事件的对话数据中存在着对第二事件的询问(s602),如果存在,则判断是否需要将对话数据与第二事件进行关联记录(s603)。如果判断为需要,则确定对话数据中的哪些数据需要与第二事件进行关联记录(s604)。以上方案请参见图6所示。本应用场景中考虑到了对话数据所涉及的内容,基于所涉及的内容来决定记录何种数据。
113.可以理解,本应用场景中可视与a单位签订的程序授权合同为第一事件,与b单位签订了购买办公用品的合同为第二事件。为方便描述,称与a单位签订的程序授权合同为合同1;与b单位签订了购买办公用品的合同为合同2。
114.对于s602的实现流程是:识别对话数据中是否出现有表征不同主题和/或不同主体的数据。判断为出现有时,如前述张三和李四之间的对话数据出现有两个表示不同主题的数据“程序授权合同”、“购买办公用品的合同”、以及出现有表示不同主体的数据“a单位”、“b单位”,确定在询问第一事件的对话数据中存在着对第二事件的询问。基于对话数据中出现的表征不同主体和/或不同主体的数据判断是否在询问第一事件的对话数据中存在着对第二事件的询问,可保证判断准确性,且在工程上易于实现。
115.对于s603的实现流程是:在对本流程进行说明之前,需要先清楚张三和李四的角色信息,如张三为业务人员,李四为法务人员。获得张三和李四的权限信息,如果他们的权限信息表征为他们均可访问第二事件(如均可对合同2进行查看)的情况下,将如上对话数据与合同2进行关联记录。在技术层面上,如果合同2具有自己的一个文件夹,则需要将如上对话数据记录到该文件夹下,如此后续可方便对涉及到合同2的对话数据进行查找。在张三
和李四存在有至少一方无法访问合同2,示例性地,如考虑到业务人员的级别,部分业务人员可能无法查看保密级别高的合同,业务人员张三在提交合同2后不对其开放可查看权限,为后续避免审批合同的法务人员和业务人员之间的不必要麻烦,需要数据处理设备对本次的对话数据与合同2进行关联记录。
116.对于s603的实现流程还可以参照图7所示。在图7中,如果在询问合同1的对话数据中存在有对合同2的询问,则需要判断张三在提交合同2后是否有访问合同2的权限,如果没有,不需要将对话数据进行记录,但是需要标识合同1和合同2之间的关联性。这种标识可以是任何能够提示后面处理合同2的人员之前有人在询问合同1时也询问了合同2的方案,如在打开文件1所在的文件夹时,文件夹的左上角出现有合同2字眼。如果判断为张三在提交合同2后有访问合同2的权限,则进一步判断李四是否有访问合同2的权限。如果李四没有访问合同2的权限,判断对话数据中提及的合同2张三是否已经提交,如果已提交,则复制对话数据,由人工来确认是否将对话数据与合同2进行关联记录。这里考虑到李四没有访问2的权限,自然其无法审批合同2,需要由其他有资格访问权限2的法务人员进行审批并确认是否将对话数据与合同2进行关联记录。
117.如果李四有访问合同2的权限,判断李四是否审批完合同2(如合同2的审批结果标识位为0表明审批未完成),如果没有审批完,则需要判断是否需要其他法务人员来共同完成审批(是否需要cowork)。如果需要其他法务人员来共同完成审批,则复制对话数据,由李四和共同完成审批工作的法务人员来人工确认是否将对话数据与合同2进行关联记录。通常情况下,李四和共同完成审批工作的法务人员会确认需要将对话数据与合同2进行关联记录,数据处理设备在该人工确认下将对话数据与合同2进行关联记录。如果不需要其他法务人员来共同完成审批,仅由李四一人完成即可,数据处理设备将对话数据与合同2进行关联记录,并标识合同1和合同2之间的关联性。其中,将对话数据与合同2进行关联记录可以是将对话数据复制到合同2所在的文件下。
118.如果数据处理设备判断出李四已经审批完合同2(如合同2的审批结果标识位为1表明审批已完成),判断根据审批结果是否需要张三进行合同2的再次提交(如审批不通过需要张三进行修改后再次提交),如果需要张三进行合同2的再次提交,需要判断是否需要其他法务人员来共同完成审批。如果需要其他法务人员来共同完成审批,则复制对话数据,由李四和共同完成审批工作的法务人员来人工确认是否将对话数据与合同2进行关联记录。如果不需要其他法务人员来共同完成审批,仅由李四一人完成即可,则数据处理设备复制对话数据到合同2的文件夹下,以将对话数据与合同2进行关联记录。同时,标识合同1和合同2之间的关联性。如果不需要张三进行合同2的再次提交,则标识合同1和合同2之间的关联性,不需要复制对话。
119.此外,还可以根据张三在对话数据中对合同2进行询问的询问意图,如果其仅是随口一问、并非正式询问,那么可不将对话数据与合同2进行关联记录。如果其并非随口一问、为正式询问,则可将对话数据与合同2进行关联记录。
120.在数据处理设备判断为需要将对话数据与第二事件进行关联记录的情况下,数据处理设备可将整个对话数据进行复制,并记录到合同2所在的文件夹下,以实现对话数据与合同2之间的关联记录。此外,因为对话数据中部分数据是针对合同1进行交流而产生的数据,部分数据为针对合同2进行交流而产生的数据。所以,还可以将整个对话数据中将针对
合同2进行交流而产生的数据提取出,进而将其与合同2进行关联记录。
121.参见图8所示,具体的提取出整个对话数据中针对合同2进行交流而产生的数据的过程是:在数据处理设备监控到存在对话数据的情况下,数据处理设备识别对话数据。如果对话数据包括多个句子,可以对每个句子中是否出现有表示主题和/或主体的词汇进行识别、和/或修饰合同的词汇出现如“合同2处理得很棒”中的“处理得很棒”或“棒”。如果在一个句子中识别出有表示主题和/或主体的词汇,需要对这个词汇及其表示为何种主题和/或主体进行保存,以便判断后续句子中是否出现有表示主题和/或主体的新词汇。如果出现有新的词汇,则从这句话开始对话双方将会针对另一个合同进行交流,这句话可视为与合同2有关的对话内容的起始点。以前述对话数据的“希望与a单位签订的程序授权合同尽快被审批完,那与b单位签订的购买办公用品的合同呢?”为例,经过对对话数据的识别,可知“a单位”、“程序授权合同”为对话数据中出现的第一个表示主体和主题的词汇。相对于该词汇,前述句子中出现的“b单位”、“购买办公用品的合同”为新出现的表示主体和主题的词汇,意味着该句子为与合同2有关的对话内容的起始点,可从该起始点进行复制。识别对话数据中在前述句子之后出现的句子中是否出现有不同于“b单位”、“购买办公用品的合同”的主体和/或主题的词汇,如果出现,则从出现有不同于“b单位”、“购买办公用品的合同”的主体和/或主题的词汇所在句子开始,对话双方将会对另一个合同进行交流,出现有不同于“b单位”、“购买办公用品的合同”的主体和/或主题的词汇所在的句子或者该句子的前一个句话可以视为与合同2有关的对话内容的结束点,可从起始点进行复制到结束点,复制的内容即为整个对话数据中对话双方就合同2进行交流的数据。这里考虑到自然语言的输出特性,句子中主谓或主谓宾成份并非都会存在,可通过判断各个句子是否均存在成份缺失来判断句子中是否存在缺省数据。如果存在成份缺失,则缺失的成份即可认为是缺省数据,缺失成份在句子中所处的位置即为需要添加缺省数据的位置。如前述对话数据中的“希望与a单位签订的程序授权合同尽快被审批完,那与b单位签订的购买办公用品的合同呢?”中的后半句是缺少句子成分的,那么缺少的这个成分(缺省数据)为何种数据,还需要对前文进行追溯,对缺省数据进行自动补全。可以理解,按照自然语言的输出特性,因为有“希望与a单位签订的程序授权合同尽快被审批完”的参照,可知后半句意在询问“与b单位签订的购买办公用品的合同何时能够审批完”,“何时能够审批完”即为缺省数据,可将“何时能够审批完”添加到需要添加的位置上即“与b单位签订的购买办公用品的合同”之后,使句子变得更为完整,表达更为清晰。
122.前述方案中,对对话数据进行内容识别,实现了在询问第一事件的对话数据中是否存在有对第二事件的询问的判断,如果在询问第一事件的对话数据中存在有对第二事件的询问,可将对话数据中与第二事件有关的数据提取出,并与第二事件进行关联记录。
123.为一种能够对话数据或对话数据中与转移事件相关的数据和转移事件进行关联记录的方案。将转移事件相关的数据和转移事件进行关联记录,为一种针对性记录方案。相对于相关技术中不会考虑对话数据本身涉及的内容仅对对话数据进行保存的方案相比,这种记录方案更为细腻。将涉及到某个事件的数据与该事件进行关联记录,按照关联记录的内容即可获知有哪些业务人员询问过转移事件以及询问内容,实现对作为证据的对话数据的快速且准确查找。且由于会进行缺省数据的添加,所以被关联记录下的信息中不会存在含义不清楚的问题。前述方案不会由于对话数据涉及到两个或多个事件的内容而造成的对
转移事件的对话数据的漏记录,对同一事件其记录的对话数据会更全面。
124.本申请实施例还提供一种数据处理设备,如图9所示,包括:获得单元101、第一识别单元102、判断单元103和记录单元104;其中,
125.获得单元101,用于获得对话数据;
126.第一识别单元102,用于识别对话数据的内容;
127.判断单元103,用于判断对话内容中是否出现第一预定事件,其中所述第一预定事件表征所述对话内容由第一内容转移到第二内容;其中,第一内容为针对第一事件的内容,第二内容为针对第二事件的内容;
128.记录单元104,用于在判断单元103判断为出现有第一预定事件的情况下,将所述对话数据与第二事件进行关联记录。
129.在一个可选的方案中,所述判断单元103,用于识别对话数据中的目标数据,其中所述目标数据为对话数据中表征主题和/或主体的数据;
130.在对话数据中出现有两个不同目标数据的情况下,判断对话内容中出现有第一预定事件。
131.在一个可选的方案中,所述设备还包括第二识别单元,用于在判断单元103判断为出现有第一预定事件的情况下,对所述对话数据中表征主题和/或主体的数据进行识别;依据识别结果,从对话数据中确定出对应于第二内容的数据;记录单元104,用于将确定出的所述数据与第二事件进行关联记录。
132.在一个可选的方案中,所述第二识别单元,还用于:
133.识别所述对话数据中出现的第一数据,所述第一数据表征第二事件的主题和/或主体;
134.对所述对话数据中位于所述第一数据之后的数据进行识别;
135.确定所述对话数据中位于所述第一数据之后的数据中是否出现有第二数据,所述第二数据表征主题和/或主体、且第二数据表征的主题和/或主体与第一事件的主题和/或主体不同;
136.确定为是的情况下,获得所述对话数据中位于第一数据和第二数据之间的数据,并将其作为所述对话数据中对应于第二内容的数据。
137.在一个可选的方案中,所述第二识别单元,还用于:
138.在所述确定为是的情况下,确定所述对话数据中所述第一数据和第二数据之间是否存在有针对第二内容的缺省数据;
139.在确定为是的情况下,识别所述第二数据出现之前在所述对话数据中出现的第一数据,所述第一数据表征第一事件的主题和/或主体;
140.在所述对话数据中所述第一数据和第二数据之间出现有所述缺省数据的情况下,确定所述缺省数据在第一数据和第二数据之间的添加位置;
141.将所述缺省数据添加到所述位置上;
142.将添加有所述缺省数据后第一数据和第二数据之间的数据作为对应于第二内容的数据。
143.在一个可选的方案中,所述设备还包括确定单元,用于:
144.确定是否存在有针对第一事件的未处理数据和针对第二事件的未处理数据;
145.确定为存在的情况下,确定针对第一事件的未处理数据和针对第二事件的未处理数据是否能够合并处理;
146.确定为不能合并处理的情况下,触发第一识别单元102识别对话数据的内容。
147.在一个可选的方案中,所述设备还包括第三识别单元,用于:在判断单元103判断为出现有第一预定事件的情况下,识别第二内容的对话意图,得到识别结果;
148.在所述识别结果表征为所述第二内容的对话意图为预定意图的情况下,触发记录单元104将所述对话数据与所述第二事件进行关联记录;
149.在所述识别结果表征为所述第二内容的对话意图为非预定意图的情况下,触发记录单元104标识所述第一事件和第二事件之间的关联性。
150.在一个可选的方案中,所述设备还包括确定单元,用于:
151.获得产生所述对话数据的通信双方中至少一方的权限信息;
152.根据所述权限信息,确定是否将所述对话数据与第二事件进行关联记录。
153.在一个可选的方案中,所述确定单元,用于:
154.在所述通信双方的权限信息表征为所述通信双方均可访问所述第二事件的情况下,触发记录单元104将所述对话数据与第二事件进行关联记录;
155.在所述通信双方存在有至少一方无法访问所述第二事件的情况下,获得无法访问所述第二事件的通信方的角色信息;依据角色信息,确定是否将所述对话数据与第二事件进行关联记录。
156.可以理解,所述设备中的获得单元101、第一识别单元102、判断单元103、记录单元104、第二识别单元、第三识别单元和确定单元在实际应用中均可由数据处理设备的中央处理器(cpu,central processing unit)、数字信号处理器(dsp,digital signal processor)、微控制单元(mcu,microcontroller unit)或可编程门阵列(fpga,field-programmable gate array)实现。
157.需要说明的是,本申请实施例的数据处理设备,由于该数据处理设备解决问题的原理与前述的数据处理方法相似,因此,数据处理设备的实施过程及实施原理均可以参见前述数据处理方法的实施过程及实施原理描述,重复之处不再赘述。
158.本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时至少用于执行图1至图8任一所示方法的步骤。所述计算机可读存储介质具体可以为存储器。所述存储器可以为如图9所示的存储器62。
159.图10为本申请实施例的数据处理设备的硬件结构示意图,如图9所示,数据处理设备包括:用于进行数据传输的通信组件63、至少一个处理器61和用于存储能够在处理器61上运行的计算机程序的存储器62。终端中的各个组件通过总线系统64耦合在一起。可理解,总线系统64用于实现这些组件之间的连接通信。总线系统64除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图9中将各种总线都标为总线系统64。
160.其中,所述处理器61执行所述计算机程序时至少执行图1至图8任一所示方法的步骤。
161.可以理解,存储器62可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、
可编程只读存储器(prom,programmable read

only memory)、可擦除可编程只读存储器(eprom,erasable programmable read

only memory)、电可擦除可编程只读存储器(eeprom,electrically erasable programmable read

only memory)、磁性随机存取存储器(fram,ferromagnetic random access memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd

rom,compact disc read

only memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,random access memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,static random access memory)、同步静态随机存取存储器(ssram,synchronous static random access memory)、动态随机存取存储器(dram,dynamic random access memory)、同步动态随机存取存储器(sdram,synchronous dynamic random access memory)、双倍数据速率同步动态随机存取存储器(ddrsdram,double data rate synchronous dynamic random access memory)、增强型同步动态随机存取存储器(esdram,enhanced synchronous dynamic random access memory)、同步连接动态随机存取存储器(sldram,synclink dynamic random access memory)、直接内存总线随机存取存储器(drram,direct rambus random access memory)。本申请实施例描述的存储器62旨在包括但不限于这些和任意其它适合类型的存储器。
162.上述本申请实施例揭示的方法可以应用于处理器61中,或者由处理器61实现。处理器61可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器61中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器61可以是通用处理器、dsp,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器61可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器62,处理器61读取存储器62中的信息,结合其硬件完成前述方法的步骤。
163.在示例性实施例中,数据处理设备可以被一个或多个应用专用集成电路(asic,application specific integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic device)、复杂可编程逻辑器件(cpld,complex programmable logic device)、fpga、通用处理器、控制器、mcu、微处理器(microprocessor)、或其他电子元件实现,用于执行前述的数据处理方法。
164.在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
165.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
166.另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
167.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
168.或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
169.本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
170.本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
171.本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
172.以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1