游戏事件抽取方法、装置、存储介质及服务器与流程

文档序号:24130610发布日期:2021-03-02 17:38阅读:114来源:国知局
游戏事件抽取方法、装置、存储介质及服务器与流程

[0001]
本申请涉及信息处理技术领域,具体涉及一种游戏事件抽取方法、装置、存储介质及服务器。


背景技术:

[0002]
信息抽取在海量的数据处理中有着非常重要的作用,其中,事件抽取是信息抽取领域的一个重要研究方向,事件抽取任务是从数据中抽取结构化的事件信息,包括事件的类型、触发词、事件的论元角色。事件抽取应用很广,在游戏领域,可以抽取玩家群体讨论的话题、反馈的游戏意见等信息,便于精准运营和游戏迭代优化。
[0003]
但是,现有的事件抽取方法依赖标注数据训练事件抽取模型,在标注数据缺乏的情况下,难以保证抽取的准确性。


技术实现要素:

[0004]
本申请的目的在于提供一种游戏事件抽取方法、装置、存储介质及服务器,以在标注数据缺乏的情况下保证事件抽取的准确性。
[0005]
本申请实施例提供了一种游戏事件抽取方法,包括:
[0006]
获取多个待处理数据;
[0007]
通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;
[0008]
根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;
[0009]
确定数据组中满足预设条件的目标数据组;
[0010]
确定目标数据组中待处理数据包含的目标游戏事件。
[0011]
本申请实施例还提供了一种游戏事件抽取装置,包括:
[0012]
第一获取模块,用于获取多个待处理数据;
[0013]
第一确定模块,用于通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;
[0014]
分组模块,用于根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;
[0015]
第二确定模块,用于确定数据组中满足预设条件的目标数据组;
[0016]
第三确定模块,用于确定目标数据组中待处理数据包含的目标游戏事件。
[0017]
其中,第三确定模块具体包括:
[0018]
获取单元,用于获取目标数据组中每个待处理数据包含的谓语词组;
[0019]
转换单元,用于将谓语词组转换为对应的词向量;
[0020]
分析单元,用于对词向量进行聚类分析,得到对应目标数据组的类内聚合度;
[0021]
第一确定单元,用于确定类内聚合度小于预设阈值的目标数据组中待处理数据包含的目标游戏事件。
[0022]
其中,第二确定模块具体包括:
[0023]
统计单元,用于统计每个数据组中待处理数据的数量;
[0024]
第二确定单元,用于确定数量大于预设数量的数据组为目标数据组。
[0025]
其中,第一确定模块具体包括:
[0026]
提取单元,用于从每个待处理数据中提取关键词组;
[0027]
链接单元,用于将关键词组中每个关键词链接到已构建的知识图谱中对应的实体上,以得到对应的实体组,每个待处理数据对应一个实体组;
[0028]
第三确定单元,用于确定实体组中每个实体所属的实体类型;
[0029]
分组单元,用于将每个待处理数据对应的实体类型归为一组,得到相应的第一实体类型组。
[0030]
其中,游戏事件抽取装置还包括:
[0031]
第二获取模块,用于获取多个用户输入数据;
[0032]
第四确定模块,用于利用已训练的预定义事件抽取模型确定每个用户输入数据对应的第二实体类型组和至少一个事件动作、以及相对于多个预定义事件类型的概率分布;
[0033]
判断模块,用于根据第二实体类型组、至少一个事件动作和概率分布,判断是否存在包含预定义事件的用户输入数据;
[0034]
第五确定模块,用于当存在包含预定义事件的用户输入数据时,将被包含的预定义事件作为对应的事件抽取结果;
[0035]
第六确定模块,用于当存在不包含预定义事件的用户输入数据时,将对应的用户输入数据作为待处理数据。
[0036]
其中,游戏事件抽取装置还包括:
[0037]
更新模块,用于根据目标游戏事件对预定义事件进行更新,并根据目标游戏事件对已训练的预定义事件抽取模型进行更新。
[0038]
其中,判断模块具体包括:
[0039]
第四确定单元,用于对于同一预定义事件,当用户输入数据对应的第二实体类型组包括预定义事件的预定义实体类型,对应的至少一个事件动作包括预定义事件的预定义事件动作,且对应的预定义事件类型的概率大于预设概率时,确定用户输入数据包含对应的预定义事件;
[0040]
第五确定单元,用于对于同一预定义事件,当用户输入数据对应的第二实体类型组不包括预定义事件的预定义实体类型,和/或对应的至少一个事件动作不包括预定义事件的预定义事件动作,和/或对应的预定义事件类型的概率不大于预设概率时,确定用户输入数据不包含对应的预定义事件。
[0041]
本申请实施例还提供了一种计算机可读存储介质,存储介质中存储有多条指令,指令适于由处理器加载以执行上述任一项游戏事件抽取方法。
[0042]
本申请实施例还提供了一种服务器,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一项游戏事件抽取方法中的步骤。
[0043]
本申请提供的游戏事件抽取方法、装置、存储介质及服务器,通过获取多个待处理数据,并通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中
包括多个实体、以及每个实体对应的实体类型,然后根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组,并确定数据组中满足预设条件的目标数据组,之后确定目标数据组中待处理数据包含的目标游戏事件,从而在进行事件抽取时,无需标注数据训练模型,即可自动发现事件,能够在标注数据缺乏的情况下能够保证抽取的准确性。
附图说明
[0044]
下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。
[0045]
图1是本申请实施例提供的游戏事件抽取系统的场景示意图;
[0046]
图2是本申请实施例提供的游戏事件抽取方法的流程示意图;
[0047]
图3是本申请实施例提供的游戏事件抽取方法的另一流程示意图;
[0048]
图4是本申请实施例提供的知识图谱的结构示意图;
[0049]
图5是本申请实施例提供的游戏事件抽取方法的另一流程示意图;
[0050]
图6是本申请实施例提供的预定义事件抽取模型的结构示意图;
[0051]
图7是本申请实施例提供的游戏事件抽取装置的结构示意图;
[0052]
图8是本申请实施例提供的服务器的结构示意图。
具体实施方式
[0053]
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0054]
本申请实施例提供一种游戏事件抽取方法、装置、存储介质及服务器。
[0055]
请参阅图1,图1为本申请实施例提供的游戏事件抽取系统的场景示意图,该游戏事件抽取系统可以包括本申请实施例提供的任一种游戏事件抽取装置,该游戏事件抽取装置具体可以集成在服务器11,比如游戏服务器中,其中服务器11可以是单台服务器,也可以是由多个服务器组成的服务器集群。
[0056]
该服务器11可以获取多个待处理数据;通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;确定数据组中满足预设条件的目标数据组;确定目标数据组中待处理数据包含的目标游戏事件。
[0057]
此外,上述游戏事件抽取系统还可以包括与服务器11通过网络21连接的多个终端311/312/313,其中,终端311/312/313可以是智能手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(personal computer,pc)等设备,该终端311/312/313可以接收用户输入的待处理数据,并将该待处理数据发送给服务器11。具体地,上述终端311/312/313可以是运行游戏的设备,上述待处理数据可以是游戏玩家在游戏内进行发言、向客服提问或搜索攻略等操作时,所产生的言论数据、咨询客服问题或内部搜索数据等用户数据,相应地,上述知识图谱可以是游戏领域的知识图谱。
[0058]
在一个实施场景中,上述服务器11可以收集一段时间内上述多个终端311/312/
313发送的多个待处理数据,并通过在已构建的知识图谱中进行实体链接,确定每个待处理数据所包含的实体组、以及实体组中每个实体对应的实体类型,以得到每个待处理数据对应的第一实体类型组,其中,实体组为至少一个实体的集合,第一实体类型组为至少一个实体类型的集合,以待处理数据为“界面在副本页卡住了”为例,该待处理数据所包含的实体组为{界面;副本},其中,实体“界面”对应的实体类型为实体类型a,实体“副本”对应的实体类型可以实体类型b,则该待处理数据对应的第一实体类型组为{实体类型a;实体类型b},然后根据第一实体类型组将上述多个待处理数据分成至少一个数据组,同一数据组中不同待处理数据对应的第一实体类型组相同,接着确定数据组中满足预设条件的目标数据组,并确定目标数据组中待处理数据包含的目标游戏事件,得到对应的事件抽取结果,从而使得游戏开发人员可以基于该事件抽取结果得到游戏玩家在过去的一段时间内讨论的热门话题、反馈的游戏设计或开发问题、重点关注的攻略玩法等信息,以便于对游戏的精准运营和迭代优化。
[0059]
如图2所示,图2是本申请实施例提供的游戏事件抽取方法的流程示意图,该游戏事件抽取方法具体流程可以如下:
[0060]
s101.获取多个待处理数据。
[0061]
在本实施例中,上述游戏事件抽取方法可以但不限于应用于游戏、智能问答、用户个性化推荐等领域中,并且,为了方便描述和理解,本申请实施例以游戏领域为例进行说明。
[0062]
在上述游戏事件抽取方法应用于游戏领域中时,上述待处理数据可以是游戏玩家在游戏内进行发言、向客服提问或搜索攻略等操作时,所产生的言论数据、咨询客服问题或内部搜索数据等用户数据。具体实施时,上述游戏事件抽取装置可以收集一段时间(比如,过去十分钟)内大量游戏玩家在游戏内产生的言论数据、咨询客服问题或内部搜索数据等用户输入数据,以得到上述多个待处理数据。
[0063]
s102.通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型。
[0064]
其中,如图3所示,上述s102可以具体包括:
[0065]
s1021.从每个待处理数据中提取关键词组。
[0066]
具体地,上述游戏事件抽取装置可以对每个待处理数据依次进行分词、以及提取与实体相关的关键词等处理,以得到对应的关键词组,其中,待处理数据可以为文本数据(比如,中文短文本),对应关键词可以为文本数据中所包含的名词。在一些实施例中,上述待处理数据中可以包含文本内容和非文本内容(比如,图像、表情动图、音频等),上述s1021可以具体包括:将待处理数据中的非文本内容进行文本转换,并将文本转换后得到的文本数据与该待处理数据中的文本内容数据进行拼接,以得到对应的目标文本数据,接着对该目标文本数据进行分词、以及提取与实体相关的关键词等处理,以得到对应的关键词组。
[0067]
s1022.将关键词组中每个关键词链接到已构建的知识图谱中对应的实体上,以得到对应的实体组,每个待处理数据对应一个实体组。
[0068]
其中,知识图谱是一种通过语义关联把真实世界和/或虚拟世界中存在的各种实体关联起来的图谱组织形式,主要由节点、边和节点属性形成图结构。其中,每个实体用一个全局唯一确定的编码来标识,每个属性-值对用来刻画实体的内在属性,而边用来连接两
个实体,刻画它们之间的关联。
[0069]
在本实施例中,上述知识图谱可以为选定游戏的知识图谱,如图4所示,该知识图谱中包括多个实体(比如,“童男”、“童女”、“地藏王”、“晴明”、“树妖”等)、以及每个实体对应的实体类型(比如,“童男”和“童女”具有相同的实体类型“式神”,“地藏王”和“树妖”具有相同的实体类型“御魂”、“晴明”对应的实体类型为“阴阳师”)。并且,为了构建该选定游戏的知识图谱,可以先构建知识图谱的本体,该本体可以包括多个系统,每个系统可以包含多个实体,然后利用爬虫爬取选定游戏的官方网站的游戏数据,主要包括英雄、皮肤、道具等关键实体以及实体的属性以及实体之间的关联关系,然后利用爬取到的游戏数据生成选定游戏的知识图谱。具体实施时,为了提高事件抽取结果的准确性,上述知识图谱中可以包括与实体类型同名称的实体,例如,如图4所示,知识图谱中包括的实体类型有“式神”、“御魂”和“阴阳师”,则在一些实施例中,该知识图谱中可以包括实体“式神”、“御魂”和/或“阴阳师”,且这三个实体“式神”、“御魂”和“阴阳师”对应的实体类型可以与实体同名称,也即为“式神”、“御魂”和“阴阳师”。以待处理数据为“童男装备什么御魂?”为例,该待处理数据中包含的实体有“童男”和“御魂”,对应的实体类型可以分别为“式神”和“御魂”,也即,“御魂”既是知识图谱中的实体类型,又是该知识图谱中的实体。
[0070]
需要说明的是,上述实体组为实体的集合,且可以包括至少一个实体。当一个关键词组中任意一个关键词都无法链接到知识图谱中对应的实体上时,可以认为该关键词组对应的待处理数据为不相关数据,并可将该待处理数据删掉,以在后续步骤中无需对该待处理数据进行事件抽取。并且,鉴于一个关键词组中每个关键词并不是都可以被链接到知识图谱中对应的实体上的,故对应实体组中实体的数量一般不大于该关键词组中关键词的数量。可以理解的是,上述实体组中的实体是知识图谱中可以被对应关键词组中的关键词链接到的实体。
[0071]
s1023.确定实体组中每个实体所属的实体类型。
[0072]
具体地,可以通过查询上述知识图谱来得到实体组中每个实体所属的实体类型。例如,继续参阅图4,通过查询知识图谱可知,实体“晴明”对应的实体类型为“阴阳师”。
[0073]
如此,通过构建选定游戏的知识图谱,并使用知识图谱的实体链接技术,得到待处理数据中包含的实体、以及实体所属的实体类型,能够避免游戏专有名词对事件抽取结果准确性的影响。
[0074]
可以理解的是,上述s1021~s1023示例了通过在已构建的知识图谱中进行实体链接以确定待处理数据所包含的实体及对应的实体类型的一种可能的实施方式。但是本申请实施例对通过在已构建的知识图谱中进行实体链接以确定待处理数据所包含的实体及对应的实体类型的实施方式不作限定。例如,上述s102还可以具有包括:从每个待处理数据中提取关键词组;对关键词组中每个关键词通过知识图谱的模糊查询进行匹配,找到每个关键词可能表达的至少一个实体,以得到每个词对应的实体候选组;从每一实体候选组中确定与对应的关键词之间的相似度最大的实体,并将关键词组中所有关键词对应的相似度最大的实体归为一组,以得到关键词组对应的实体组,其中,每个待处理数据对应一个实体组;接着,确定实体组中每个实体所属的实体类型。
[0075]
s1024.将每个待处理数据对应的实体类型归为一组,得到相应的第一实体类型组。
[0076]
其中,上述第一实体类型组为实体类型的集合,且可以包括至少一个实体类型。第一实体类型组中任意两个实体类型均不相同,该第一实体类型组仅与对应待处理数据所包含的实体类型的种类有关,而与该待处理数据所包含的属于同一实体类型的实体的数量无关。例如,若待处理数据1包括三个实体t1、t2、t3,三者对应的实体类型分别为c1、c2、c2,则待处理数据1对应的第一实体类型组为{c1;c2},若待处理数据2包括两个实体t4、t5,二者对应的实体类型分别为c1、c2,则待处理数据2对应的第一实体类型组也为{c1;c2},由此可知,待处理数据1和待处理数据2二者对应的第一实体类型组相同。
[0077]
s103.根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组。
[0078]
其中,同一数据组中任意两个待处理数据对应的第一实体类型组均相同,也即,上述s103可以具体包括:将对应的第一实体类型组相同的待处理数据归为一组,接上一例子,待处理数据1和待处理数据2二者对应的第一实体类型组相同,故分组后二者会位于同一数据组中。
[0079]
s104.确定数据组中满足预设条件的目标数据组。
[0080]
其中,上述s104可以具体包括:
[0081]
s1041.统计每个数据组中待处理数据的数量。
[0082]
s1042.确定数量大于预设数量的数据组为目标数据。
[0083]
具体地,一个数据组中所包含的待处理数据的数量越多,说明该数据组中待处理数据所描述的事件为常规事件或高频事件的可能性越大,也即,说明该数据组包含游戏玩家在过去的一段时间内讨论的热门话题、反馈的游戏设计或开发问题、重点关注的攻略玩法等信息的可能性越大,相应地,后续对该数据组中待处理数据进行事件抽取得到的结果具有更大的实用价值。并且,具体实施时,上述游戏事件抽取装置可以将包含的待处理数据的数量大于预设阈值(比如,500)的数据组作为目标数据。
[0084]
s105.确定目标数据组中待处理数据包含的目标游戏事件。
[0085]
其中,继续参阅图3,上述s105可以具体包括:
[0086]
s1051.获取目标数据组中每个待处理数据所包含的谓语词组。
[0087]
具体地,上述游戏事件抽取装置可以对目标数据组中每个待处理数据依次进行分词处理、以及提取谓语词组处理,以得到每个待处理数据所包含的谓语词组。其中,一个待处理数据所包含的谓语词组可以理解为该待处理数据所包含的谓语成分,且该谓语词组可以由至少一个谓语词组成。
[0088]
s1052.将谓语词组转换为对应的词向量。
[0089]
具体地,上述游戏事件抽取装置可以利用已训练的word2vec词向量工具将每个待处理数据所包含的谓语词组转换为对应的词向量。其中,一个谓语词组对应一个词向量。
[0090]
s1053.对词向量进行聚类分析,得到对应目标数据组的类内聚合度。
[0091]
具体地,上述游戏事件抽取装置可以对同一目标数据组对应的所有词向量进行聚类分析,得到对应目标数据组的类内聚合度。其中,上述类内聚合度可用于表征对应目标数据组中不同待处理数据所描述的事件之间的相似程度,并可以理解为类内各样本到类中心的平均距离,其计算公式可以如下:
[0092]
[0093]
其中,d为类内聚合度,n为对应目标数据组中待处理数据的数量,pi为对应目标数据组中第i个待处理数据对应的词向量,c为类中心,其中,d越小,说明对应目标数据组中不同待处理数据所描述的事件之间的相似程度越大。
[0094]
在本实施例中,鉴于动作一般是事件触发的核心词,故选取待处理数据的谓语成分进行聚类,能够避免待处理数据中无用成分对事件抽取的准确性的影响。
[0095]
s1054.确定类内聚合度小于预设阈值的目标数据组中待处理数据包含的目标游戏事件。
[0096]
其中,当类内聚合度小于预设阈值时,可以认为对应目标数据组中不同待处理数据所描述或所包含的事件相同,并可以将该目标数据组中待处理数据所描述或所包含的事件定义为一个目标游戏事件。具体地,对于每个上述类内聚合度小于预设阈值的目标数据组,上述游戏事件抽取装置可以通过将该目标数据组中的每个待处理数据输入已训练的事件分类模型,以得到每个待处理数据对应的事件类型,并将该目标数据组中待处理数据对应的概率最大(也即,出现次数最多)的一个事件类型定义为该目标数据组中待处理数据所包含的目标游戏事件的事件类型。
[0097]
在一些实施例中,对于每个上述类内聚合度小于预设阈值的目标数据组,上述游戏事件抽取装置还可以将该目标数据组对应的第一实体类型组中所包含的实体类型定义为该目标数据组中待处理数据所包含的目标游戏事件的事件实体类型,并可以将该目标数据组中待处理数据所包含的出现次数最多的一个或多个谓语词定义为该目标数据组中待处理数据所包含的目标游戏事件的事件动作。如此,上述游戏事件抽取装置可以将得到的目标游戏事件作为对应目标数据组中待处理数据的事件抽取结果,以使得游戏开发人员可以基于该事件抽取结果得到游戏玩家在过去的一段时间内讨论的热门话题、反馈的游戏设计或开发问题、重点关注的攻略玩法等信息,从而便于对游戏的精准运营和迭代优化。
[0098]
由上可知,本实施例提供的游戏事件抽取方法,通过获取多个待处理数据,并通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型,然后根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组,并确定数据组中满足预设条件的目标数据组,接着确定目标数据组中待处理数据包含的目标游戏事件,从而在进行事件抽取时,无需标注数据训练模型,即可自动发现事件,以在标注数据缺乏的情况下,与现有的无监督事件抽取方法相比,能够具有更高的事件抽取准确性。
[0099]
如图5所示,图5是本申请实施例提供的游戏事件抽取方法的另一流程示意图,该游戏事件抽取方法具体流程可以如下:
[0100]
s201.获取多个用户输入数据。
[0101]
在本实施例中,上述游戏事件抽取方法可以应用于选定游戏应用中,上述游戏事件抽取装置可以收集一段时间(比如,过去十分钟)内大量游戏玩家在游戏内产生的言论数据、咨询客服问题或内部搜索数据等用户数据,以得到多个用户输入数据。
[0102]
s202.利用已训练的预定义事件抽取模型确定每个用户输入数据对应的第二实体类型组和至少一个事件动作、以及相对于多个预定义事件类型的概率分布。
[0103]
在本实施例中,上述预定义事件抽取模型用于发现与预定义事件同类的事件,如图6所示,该预定义事件抽取模型主要包括三个任务,也即,序列标注任务、事件分类任务和
动作发现任务。其中,序列标注任务用于得到用户输入数据中所包含的第二实体类型组,第二实体类型组中包含有至少一个实体类型,事件分类任务用于得到用户输入数据相对于多个预定义事件类型的概率分布,动作发现任务用于得到用户输入数据中所包含的至少一个事件动作。
[0104]
具体地,继续参阅图6,在上述游戏事件抽取装置将用户输入数据(比如,待处理文本“达摩找不到了”)输入上述预定义事件抽取模型之后,上述预定义事件抽取模型首先以字建模,将输入的文本中每个字转换为对应的字向量61,并将得到的字向量61输入到已训练的albert模型,以使得该albert模型输出文本中每个字位置上结合上下文信息的向量表示62,其中,albert模型又名a lite bert模型,是由谷歌发布的一种轻量级bert模型。接着,在序列标注任务阶段,按位置输出每个字为实体类型的概率,进而得到输入的文本中所包含的第二实体类型组(例如,文本“达摩找不到了”中所包含的第二实体类型组为{道具});在事件分类任务阶段,通过max-pooling(最大池化)得到输入文本的句子表示,并根据该句子表示进行句子分类,以得到输入文本相对于多个预定义事件类型的概率分布;在动作发现任务阶段,可以从输入文本对应的多个向量表示62中确定至少一个动作词向量,并将每一动作词向量与句子表示拼接后经过全连接网络fc输出二者的相关度,并将与句子表示之间的相关度大于预设值的动作词向量对应的动作词作为输入的文本中所包含的事件动作。
[0105]
在一个实施例中,为了训练上述预定义事件抽取模型,在上述s201之前还可以包括:
[0106]
s41.定义多个预定义事件,每个预定义事件包括预定义事件类型和预定义事件要素。
[0107]
其中,预定义事件要素可以包括预定义实体类型和预定义事件动作,预定义实体类型可理解为预定义事件中所包含的一些实体所属的实体类型,预定义事件动作可理解为预定义事件中所包含的一些操作词(比如,谓语词),预定义事件类型用于对预定义事件进行类别划分。例如,一个预定义事件的预定义事件类型可以为“游戏bug”,预定义实体类型可以有“界面”和“副本”,预定义事件动作可以为“卡住”。
[0108]
s42.将预定义事件的预定义实体类型、预定义事件动作和预定义事件类型作为训练数据,对预设的预定义事件抽取模型进行训练,以得到已训练的预定义事件抽取模型。
[0109]
具体实施时,上述游戏事件抽取装置可以对预设的预定义事件抽取模型的三个任务进行联合训练,且可以定义该预定义事件抽取模型训练的目标函数loss为三者的加权平均值,也即,loss=α*loss1+β*loss2+γ*loss3,其中,α+β+γ=1,loss1、loss2和loss3分别为上述三个任务的损失函数。
[0110]
s203.根据第二实体类型组、至少一个事件动作和概率分布,判断是否存在包含预定义事件的用户输入数据。
[0111]
具体地,上述s203可以具体包括:
[0112]
s2031.对于同一预定义事件,当用户输入数据对应的第二实体类型组包括预定义事件的预定义实体类型,对应的至少一个事件动作包括预定义事件的预定义事件动作,且对应的预定义事件类型的概率大于预设概率时,确定用户输入数据包含对应的预定义事件。
[0113]
s2032.对于同一预定义事件,当用户输入数据对应的第二实体类型组不包括预定义事件的预定义实体类型,和/或对应的至少一个事件动作不包括预定义事件的预定义事件动作,和/或对应的预定义事件类型的概率不大于预设概率时,确定用户输入数据不包含对应的预定义事件。
[0114]
s204.当存在包含预定义事件的用户输入数据时,将被包含的预定义事件作为对应的事件抽取结果。
[0115]
s205.当存在不包含预定义事件的用户输入数据时,将对应的用户输入数据作为待处理数据。
[0116]
s206.获取待处理数据。
[0117]
在本实施例中,上述待处理数据可以理解为通过上述预定义事件抽取模型将上述多个用户输入数据中涉及预定义事件(比如,常规事件或高频事件)的用户输入数据过滤掉后剩下的用户输入数据,以避免后续步骤中对预定义事件的重复发现,并减小数据干扰。
[0118]
s207.通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型。
[0119]
s208.根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组。
[0120]
s209.确定数据组中满足预设条件的目标数据组。
[0121]
s210.确定目标数据组中待处理数据包含的目标游戏事件。
[0122]
其中,本实施例中的s207~s210的具体实施例方式可以参见上一方法实施例中s102~s105的具体实施方式,故在此不再赘述。
[0123]
需要说明的是,在一些替代实施例中,为了得到上述已训练的预定义事件抽取模型,还可以在发现目标游戏事件后,利用该目标游戏事件的事件类型、事件实体类型和事件动作,对预设的预定义事件抽取模型进行训练,如此,能够节省定义预定义事件的耗时,以提高事件抽取的效率。
[0124]
在一些实施例中,为了避免对已发现的目标游戏事件的重复发现,在上述s210之后,还可以包括:
[0125]
s211.根据目标游戏事件对预定义事件进行更新,并根据目标游戏事件对已训练的预定义事件抽取模型进行更新,之后返回执行上述s201。
[0126]
在本实施例中,上述游戏事件抽取装置可以利用已发现的目标游戏事件对上述预定义事件进行补充,以增加预定义事件的数量和种类,还可以利用该目标游戏事件的事件类型、事件实体类型和事件动作,对上述已训练的预定义事件抽取模型进行再训练,从而在进行下一次事件抽取时,直接通过预定义事件抽取模型抽取这一次已发现的目标游戏事件,以避免下一次对已发现的目标游戏事件的重复发现,能够提高事件抽取效率。
[0127]
可以理解的是,当将某个目标游戏事件(比如,目标游戏事件a)新增为一个预定义事件(比如,预定义事件b)时,该预定义事件b的预定义事件类型即为上述目标游戏事件a的事件类型,该预定义事件b的预定义实体类型即为上述目标游戏事件a的事件实体类型,该预定义事件b的预定义事件动作即为上述目标游戏事件a的事件动作。
[0128]
在上述实施例中,上述目标游戏事件可以为新事件,且该新事件可以为未被预先定义的、或在已得到的历史事件抽取结果中未曾被发现的事件。
[0129]
由上可知,本实施例提供的游戏事件抽取方法,在进行事件抽取时,即可自动发现
预定义事件,又可发现新事件,进而可以将发现的新事件定义为预定义事件,以避免对已发现的新事件的重复发现,提高了事件抽取的效率和准确性。
[0130]
在上述实施例所述方法的基础上,本实施例将从游戏事件抽取装置的角度进一步进行描述,请参阅图7,图7具体描述了本申请实施例提供的游戏事件抽取装置,其可以包括:第一获取模块701、第一确定模块702、分组模块703、第二确定模块704和第三确定模块705,其中:
[0131]
(1)第一获取模块701
[0132]
第一获取模块701,用于获取多个待处理数据。
[0133]
(2)第一确定模块702
[0134]
第一确定模块702,用于通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型。
[0135]
其中,上述第一确定模块702可以具体包括:
[0136]
提取单元,用于从每个待处理数据中提取关键词组;
[0137]
链接单元,用于将关键词组中每个关键词链接到已构建的知识图谱中对应的实体上,以得到对应的实体组,每个待处理数据对应一个实体组;
[0138]
第三确定单元,用于确定实体组中每个实体所属的实体类型;
[0139]
分组单元,用于将每个待处理数据对应的实体类型归为一组,得到相应的第一实体类型组。
[0140]
(3)分组模块703
[0141]
分组模块703,用于根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组。
[0142]
(4)第二确定模块704
[0143]
第二确定模块704,用于确定数据组中满足预设条件的目标数据组。
[0144]
其中,第二确定模块704可以具体包括:
[0145]
统计单元,用于统计每个数据组中待处理数据的数量;
[0146]
第二确定单元,用于确定数量大于预设数量的数据组为目标数据组。
[0147]
(5)第三确定模块705
[0148]
第三确定模块705,用于确定目标数据组中待处理数据包含的目标游戏事件。
[0149]
其中,第三确定模块705可以具体包括:
[0150]
获取单元,用于获取目标数据组中每个待处理数据包含的谓语词组;
[0151]
转换单元,用于将谓语词组转换为对应的词向量;
[0152]
分析单元,用于对词向量进行聚类分析,得到对应目标数据组的类内聚合度;
[0153]
第一确定单元,用于确定类内聚合度小于预设阈值的目标数据组中待处理数据包含的目标游戏事件。
[0154]
在一个实施例中,上述游戏事件抽取装置还可以包括:
[0155]
(6)第二获取模块
[0156]
第二获取模块,用于获取多个用户输入数据。
[0157]
(7)第四确定模块
[0158]
第四确定模块,用于利用已训练的预定义事件抽取模型确定每个用户输入数据对
应的第二实体类型组和至少一个事件动作、以及相对于多个预定义事件类型的概率分布。
[0159]
(8)判断模块
[0160]
判断模块,用于根据第二实体类型组、至少一个事件动作和概率分布,判断是否存在包含预定义事件的用户输入数据。
[0161]
其中,上述判断模块可以具体包括:
[0162]
第四确定单元,用于对于同一预定义事件,当用户输入数据对应的第二实体类型组包括预定义事件的预定义实体类型,对应的至少一个事件动作包括预定义事件的预定义事件动作,且对应的预定义事件类型的概率大于预设概率时,确定用户输入数据包含对应的预定义事件;
[0163]
第五确定单元,用于对于同一预定义事件,当用户输入数据对应的第二实体类型组不包括预定义事件的预定义实体类型,和/或对应的至少一个事件动作不包括预定义事件的预定义事件动作,和/或对应的预定义事件类型的概率不大于预设概率时,确定用户输入数据不包含对应的预定义事件。
[0164]
(9)第五确定模块
[0165]
第五确定模块,用于当存在包含预定义事件的用户输入数据时,将被包含的预定义事件作为对应的事件抽取结果。
[0166]
(10)第六确定模块
[0167]
第六确定模块,用于当存在不包含预定义事件的用户输入数据时,将对应的用户输入数据作为待处理数据。
[0168]
在另一些实施例中,上述游戏事件抽取装置还可以包括:
[0169]
(11)更新模块
[0170]
更新模块,用于根据目标游戏事件对预定义事件进行更新,并根据目标游戏事件对已训练的预定义事件抽取模型进行更新。
[0171]
具体实施时,以上各个单元和模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元和模块的具体实施可参见前面的方法实施例,在此不再赘述。
[0172]
由上可知,本实施例提供的游戏事件抽取装置,包括第一获取模块,用于获取多个待处理数据;第一确定模块,用于通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;分组模块,用于根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;第二确定模块,用于确定数据组中满足预设条件的目标数据组;第三确定模块,用于确定目标数据组中待处理数据包含的目标游戏事件,从而在进行事件抽取时,无需标注数据训练模型,即可自动发现事件,能够在标注数据缺乏的情况下能够保证抽取的准确性。
[0173]
相应的,本申请实施例还提供一种服务器,该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群,如图8所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
[0174]
该服务器800包括有一个或者一个以上处理核心的处理器801、有一个或一个以上计算机可读存储介质的存储器802及存储在存储器802上并可在处理器上运行的计算机程序。其中,处理器801与存储器802电性连接。本领域技术人员可以理解,图中示出的服务器
结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0175]
处理器801是服务器800的控制中心,利用各种接口和线路连接整个服务器800的各个部分,通过运行或加载存储在存储器802内的软件程序和/或模块,以及调用存储在存储器802内的数据,执行服务器800的各种功能和处理数据,从而对服务器800进行整体监控。
[0176]
在本申请实施例中,服务器800中的处理器801会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器802中,并由处理器801来运行存储在存储器802中的应用程序,从而实现各种功能:
[0177]
获取多个待处理数据;
[0178]
通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;
[0179]
根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;
[0180]
确定数据组中满足预设条件的目标数据组;
[0181]
确定目标数据组中待处理数据包含的目标游戏事件。
[0182]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0183]
可选的,如图8所示,服务器800还包括:触控显示屏803、射频电路804、音频电路805、输入单元806以及电源807。其中,处理器801分别与触控显示屏803、射频电路804、音频电路805、输入单元806以及电源807电性连接。本领域技术人员可以理解,图8中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0184]
触控显示屏803可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏803可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(lcd,liquid crystal display)、有机发光二极管(oled,organic light-emitting diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器801,并能接收处理器801发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器801以确定触摸事件的类型,随后处理器801根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏803而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏803也可以作为输入单元806的一部分实现输入功能。
[0185]
在本申请实施例中,通过处理器801执行游戏应用程序在触控显示屏803上生成虚拟三维场景的画面,该画面中包括图形用户界面(ui界面),该图形用户界面中包括第二空
间方位指示器,该第二空间方位指示器上显示了目标对象所对应的空间方位标识,该空间方位标识用于标示目标对象所在的方位。
[0186]
该触控显示屏803可以用于呈现虚拟三维场景的画面,以及图形用户界面并接收用户作用于图形用户界面产生的操作指令。
[0187]
射频电路804可用于收发射频信号,以通过无线通信与网络设备或其他服务器建立无线通讯,与网络设备或其他服务器之间收发信号。
[0188]
音频电路805可以用于通过扬声器、传声器提供用户与服务器之间的音频接口。音频电路805可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路805接收后转换为音频数据,再将音频数据输出处理器801处理后,经射频电路804以发送给比如另一服务器,或者将音频数据输出至存储器802以便进一步处理。音频电路805还可能包括耳塞插孔,以提供外设耳机与服务器的通信。
[0189]
输入单元806可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0190]
电源807用于给服务器800的各个部件供电。可选的,电源807可以通过电源管理系统与处理器801逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源807还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0191]
尽管图8中未示出,服务器800还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
[0192]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0193]
由上可知,本实施例提供的服务器在标注数据缺乏的情况下能够保证事件抽取的准确性。
[0194]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0195]
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种游戏事件抽取方法中的步骤。例如,该计算机程序可以执行如下步骤:
[0196]
获取多个待处理数据;
[0197]
通过已构建的知识图谱确定每个待处理数据对应的第一实体类型组,知识图谱中包括多个实体、以及每个实体对应的实体类型;
[0198]
根据第一实体类型组对多个待处理数据进行分组,得到至少一个数据组;
[0199]
确定数据组中满足预设条件的目标数据组;
[0200]
确定目标数据组中待处理数据包含的目标游戏事件。
[0201]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0202]
其中,该存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆
体(ram,random access memory)、磁盘或光盘等。
[0203]
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种游戏事件抽取方法中的步骤,因此,可以实现本申请实施例所提供的任一种游戏事件抽取方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0204]
以上对本申请实施例所提供的一种游戏事件抽取方法、装置、存储介质及服务器进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1