1.本发明属于数据感知及处理技术领域,具体涉及一种体育赛事直播的全媒体内容智能感知及关联的方法。
背景技术:2.体育赛事直播过程中,当发生一个事件时,需要搜索全媒体内容数据库,获得与事件相关的关联内容,再将关联内容匹配上,即时呈现,对实时性要求、关联内容的全面性和精确性要求均非常高。
3.上述关联内容匹配方式存在以下问题:由于全媒体内容数据库的数据量大、数据形态多、涉及范围广,全媒体内容数据库包括多条内容,每一条内容采用标签进行静态描述和关联索引,因此,难以快速、全面准确的从全媒体内容数据库中搜索到关联内容,降低体育赛事直播效果。
技术实现要素:4.针对现有技术存在的缺陷,本发明提供一种体育赛事直播的全媒体内容智能感知及关联的方法,可有效解决上述问题。
5.本发明采用的技术方案如下:
6.本发明提供一种体育赛事直播的全媒体内容智能感知及关联的方法,包括以下步骤:
7.步骤1,预建立内容库与内容索引库;
8.所述内容库用于存储多条原始内容;每条所述原始内容具有内容id;
9.所述内容索引库用于存储绑定有对应的内容id的内容索引;其中,每条所述内容索引包括多个内容属性标签;
10.步骤2,离线赛前预筛选阶段:
11.步骤2.1,针对当前待直播的体育赛事,获取赛事静态数据集;所述赛事静态数据集包括多个赛事静态数据;
12.步骤2.2,以所述赛事静态数据集中的每个赛事静态数据为检索词,检索所述内容索引库,一共预筛选得到n1条与所述赛事静态数据集相关联的内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引由此形成预筛内容索引库b0_index;
13.步骤3,事件提取过程:
14.步骤3.1,针对当前待直播的体育赛事,预定义赛事提取触发规则以及重点关注的锚点集合;其中,所述赛事提取触发规则包括多个赛事关键词;所述锚点集合包括多个锚点;
15.预定义事件层次结构;所述事件层次结构为三层结构,按自上向下的方向,包括:第一层节点,第二层节点和第三层节点;其中,所述第一层节点为根节点,用于存储一级事
件类型;所述第二层节点为所述第一层节点的子节点,包括多种不同的二级事件类型;所述第三层节点为各个所述第二层节点的子节点,用于表示二级事件类型包括的三级事件类型;其中,所述三级事件类型中,包括体育赛事事件;
16.步骤3.2,当体育赛事直播开始时,通过体育赛事直播源实时读取到当前t时刻的实时赛事数据;
17.根据步骤3.1预定义的事件层次结构,判断所述实时赛事数据是否属于体育赛事事件数据,如果不是,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果是,则进一步判断所述实时赛事数据,是否满足所述赛事提取触发规则,如果不满足,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果满足,则执行步骤3.3;
18.步骤3.3,采用事件抽取模型,从所述实时赛事数据中提取得到事件,表示为:事件event
t
={e
t1
,e
t2
,...,e
t11
};其中,e
t1
,e
t2
,...,e
t11
代表事件event
t
的11个事件变量;
19.其中:
20.e
t1
为一级事件类型变量;
21.e
t2
为二级事件类型变量;
22.e
t3
为三级事件类型变量;
23.e
t4
为赛事具体事件类型变量;
24.e
t5
为对阵双方名称变量;
25.e
t6
为当前比分变量;
26.e
t7
为事件锚点变量;
27.e
t8
为当前球员姓名变量;
28.e
t9
为当前球员所在球队名称变量;
29.e
t10
为事件简要描述变量;
30.e
t11
为事件发生时间变量;
31.从所述实时赛事数据中提取得到事件的提取方法为:
32.按照设定顺序排列11个事件变量的组合槽位,从第1个槽位开始,利用槽位识别技术确定当前槽位,再通过对所述实时赛事数据的分析,得到当前槽位的变量值,并向当前槽位填充相应的变量值;然后向后移动一个槽位,循环进行,直到完成对第11个槽位的填充,得到包含11个事件变量的事件event
t
,即为提取到的事件;如果某个槽位相应的变量值不存在,则为空;
33.其中,事件锚点变量的提取方法为:根据步骤3.1预定义的锚点集合,如果存在属于锚点集合的事件属性,则将该事件属性作为事件锚点;
34.步骤4,初步匹配过程:
35.步骤4.1,将步骤3提取到的事件event
t
,与步骤2得到的预筛选内容索引预筛选内容索引预筛选内容索引输入到已训练完成的逻辑回归模型进行补步匹配,逻辑回归模型分别计算得到事件event
t
与预筛选内容索引的匹配得分事件event
t
与预筛选内容索引的匹配得分事件event
t
与预筛选
内容索引的匹配得分
36.获得匹配得分最高的前n2个预筛选内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引其中,n2<n1,由此形成初筛内容索引库b1_index;
37.步骤4.2,由于每条预筛选内容索引均绑定有对应的内容id,因此,对于初筛内容索引库b1_index中的每一条预筛选内容索引,根据其绑定的内容id,查找步骤1预建立的内容库,得到对应的初步关联内容,将得到的n2个初步关联内容表示为:初步关联内容初步关联内容初步关联内容由此形成初步关联内容库;
38.步骤5,事件语义扩展过程:
39.步骤5.1,对事件event
t
往前进行一定时间长度的回溯,提取事件event
t
在回溯时间段内的所有前置事件,形成前置事件合集,按时间序列,依次表示为:前置事件f_event
t
(1),前置事件f_event
t
(2),...,前置事件f_event
t
(n1);其中,n1代表前置事件的总数量;
40.将n1个前置事件按时间序列的排序,称为语义扩展后的前置事件合集;
41.步骤5.2,判断步骤5.1得到的前置事件的总数量n1,是否达到设定数量阈值;如果未达到,则执行步骤5.3;如果达到,则执行步骤5.4;
42.步骤5.3,基于体育赛事知识图谱,对步骤5.1得到的n1个前置事件进行实体扩展得到二次扩展后事件合集;
43.采用二次扩展后事件合集更新步骤5.1得到的语义扩展后的前置事件合集;然后执行步骤5.4;
44.步骤5.4,设更新后的语义扩展后的前置事件合集,包括n2个按时间顺序排列的前置事件,依次提取n2个前置事件的前置事件简要描述变量description,由此得到n2个前置事件简要描述变量,依次表示为:description(1),description(2),...,description(n2),形成事件event
t
回溯时间段内重要节点的顺序简要描述,简称为事件event
t
回溯后的简要描述description(event
t
),其中,description(event
t
)={description(1),description(2),...,description(n2)};
45.将步骤5.4得到的事件event
t
回溯后的简要描述description(event
t
),以及步骤4得到的初步关联内容初步关联内容初步关联内容共同输入到深度语义匹配网络;
46.步骤6,深度语义匹配过程:
47.步骤6.1,采用深度语义匹配网络,分别计算得到初步关联内容与简要描述description(event
t
)的匹配得分初步关联内容与简要描述description(event
t
)的匹配得分初步关联内容与简要描述description(event
t
)的匹配得分
48.步骤6.2,获得匹配得分最高的前n3个初步关联内容,其中,n3<n2,并按得分由高
到低排序,得到的n3个初步关联内容,依次称为:多模态内容多模态内容多模态内容
49.步骤7,将多模态内容多模态内容多模态内容作为当前t时刻的实时赛事数据的关联内容,即时呈现。
50.优选的,所述深度语义匹配网络,采用多模型融合的深度语义匹配网络。
51.优选的,步骤6.1中,对于任意初步关联内容其中,i=1,2,...,n2,采用以下方式,得到初步关联内容与简要描述description(event
t
)的匹配得分
52.分别计算得到初步关联内容与简要描述description(event
t
)的匹配程度得分score
i_match
,初步关联内容的内容时效性得分score
i_timeliness
以及初步关联内容的内容热度得分score
i_hot
,采用下式,得到最终的匹配得分
[0053][0054]
其中:α、β和γ分别代表匹配程度权重、内容热度权重和内容时效性权重。
[0055]
优选的,初步关联内容与简要描述description(event
t
)的匹配程度得分score
i_match
,通过以下方式获得:
[0056]
步骤6.1.1,预建立深度语义匹配模型库;所述深度语义匹配模型库中存储多个深度语义匹配模型;
[0057]
步骤6.1.2,按照筛选规则,从所述深度语义匹配模型库中,筛选得到m个深度语义匹配模型,分别表示为:深度语义匹配模型model1,深度语义匹配模型model2,...,深度语义匹配模型modelm;
[0058]
步骤6.1.3,采用深度语义匹配模型model1,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_1
;
[0059]
采用深度语义匹配模型model2,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_2
;
[0060]
依此类推
[0061]
采用深度语义匹配模型modelm,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_m
;
[0062]
步骤6.1.4,对匹配得分score
model_1
,score
model_2
,...,score
model_m
进行加权融合平均,得到匹配程度得分score
i_match
。
[0063]
本发明提供的一种体育赛事直播的全媒体内容智能感知及关联的方法具有以下优点:
[0064]
本发明能够实现对体育赛事直播节目的全媒体内容智能感知及同源内容动态关联,可以快速、全面准确的从全媒体内容数据库中搜索到与当前赛事数据最为关联的关联内容,提升体育赛事直播效果。
附图说明
[0065]
图1为本发明提供的一种体育赛事直播的全媒体内容智能感知及关联的方法的流程示意图;
[0066]
图2为本发明提供的一种体育赛事直播的全媒体内容智能感知及关联的方法的详细流程示意图;
[0067]
图3为本发明提供的事件层次结构的示意图。
具体实施方式
[0068]
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0069]
根据本发明实施例,提供体育赛事直播的全媒体内容智能感知及关联的方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0070]
为解决体育赛事直播节目媒体形态繁多,信息数据庞大,生产流程复杂,同源内容“融合关联难”的问题,本发明提供一种体育赛事直播的全媒体内容智能感知及关联的方法,是一种体育赛事直播节目全媒体内容智能感知及同源内容动态关联方法,建立基于智能感知和全媒体节目单的内容动态关联,支持超高清直播视频的基于时空域特征和领域自适应的多模态智能感知技术,基于知识图谱、实时事件提取、全媒体感知框架、事件语义扩展和深度匹配网络的全媒体内容自动关联,参考图1,包括以下步骤:
[0071]
步骤1,预建立内容库与内容索引库;
[0072]
步骤2,离线赛前预筛选阶段;
[0073]
步骤3,事件提取过程;
[0074]
步骤4,初步匹配过程;
[0075]
步骤5,事件语义扩展过程;
[0076]
步骤6,深度语义匹配过程;
[0077]
步骤7,多模态内容输出,作为当前t时刻的实时赛事数据的关联内容,即时呈现。
[0078]
参考图2,本发明详细步骤如下:
[0079]
步骤1,预建立内容库与内容索引库;
[0080]
所述内容库用于存储多条原始内容;每条所述原始内容具有内容id;
[0081]
所述内容索引库用于存储绑定有对应的内容id的内容索引;其中,每条所述内容索引包括多个内容属性标签;
[0082]
具体的,为了对形式上多源异构,语义上相互关联的全媒体内容进行有效组织,利用全媒体感知框架将全媒体内容产生标签后,输出到该内容索引库,在内容索引库中,每条内容索引可以采用key和value的形式表示,其中,key可以为本条内容的关键词,例如,热门球员姓名、其他相关人员姓名、比赛场地名称、双方队名等,value值为与key相对应的多模态内容数组。key和value的整体,即构成本条内容索引的内容属性标签。
[0083]
本发明的全媒体感知框架,可以将内容库中不同模态内容,例如,文本、图片和音视频等,转为文本形式的内容并提取标签,生成内容索引。其中,标签包含但不限于内容中
涉及到的人物,地名,歌名,组织机构,广告,场景识别结果和赛事动作识别结果等。其中,全媒体感知框架,可利用的智能算法包括但不限于自然语言处理技术,语音识别技术,歌曲哼唱识别技术,人脸识别技术,文字识别技术,广告检测技术,场景识别技术及动作识别技术等。
[0084]
在具体实现上,全媒体感知框架包括四个子框架:文本感知框架、图像感知框架、音频感知框架和视频感知框架。
[0085]
全媒体感知框架包括训练数据模块,所述训练数据模块内的训练数据包括但不限于赛事视频、广告、球员尤其是球星数据,全媒体感知框架利用训练数据优化和提升识别的准确率。
[0086]
步骤2,离线赛前预筛选阶段:
[0087]
步骤2.1,针对当前待直播的体育赛事,获取赛事静态数据集;所述赛事静态数据集包括多个赛事静态数据;
[0088]
其中,静态赛事数据为本场比赛相关信息,包括但不限于赛事规则、赛事直播规则、比赛名称、比赛队伍信息、对阵双方球员姓名及教练姓名、场地、裁判姓名等。
[0089]
步骤2.2,以所述赛事静态数据集中的每个赛事静态数据为检索词,检索所述内容索引库,一共预筛选得到n1条与所述赛事静态数据集相关联的内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引由此形成预筛内容索引库b0_index;
[0090]
对于本步骤的预筛内容索引库b0_index,如果在后面步骤中没有得到关联内容,则直接将预筛内容索引库b0_index对应的内容,作为最终关联内容输出,具有替补的作用。
[0091]
步骤3,事件提取过程:
[0092]
步骤3.1,针对当前待直播的体育赛事,预定义赛事提取触发规则以及重点关注的锚点集合;其中,所述赛事提取触发规则包括多个赛事关键词;所述锚点集合包括多个锚点;
[0093]
例如,完整的赛事事件包括进球、犯规、黄牌等在内的20项赛事关键词;用户可选择核心赛事关键词,作为赛事提取触发规则,如:进球、犯规、黄牌、点球、红牌、换人、射正和红黄等在内的8项赛事关键词。当当前直播的体育赛事数据中,包含预定义的赛事关键词时,代表满足赛事提取触发规则,需要进行赛事事件提取。
[0094]
锚点集合包括多个锚点是指:预定义多个锚点,例如,将球员姓名、球队名称或事件的特殊属性等,后续步骤中,提取到的事件包含的事件锚点变量,属于锚点集合的子集。锚点实质为事件标签的重要属性,是内容初步匹配关联的起点。
[0095]
预定义事件层次结构;参考图3,所述事件层次结构为三层结构,按自上向下的方向,包括:第一层节点,第二层节点和第三层节点;其中,所述第一层节点为根节点,用于存储一级事件类型;所述第二层节点为所述第一层节点的子节点,包括多种不同的二级事件类型;所述第三层节点为各个所述第二层节点的子节点,用于表示二级事件类型包括的三级事件类型;其中,所述三级事件类型中,包括体育赛事事件;
[0096]
因此,事件层次结构是对事件类型的分层定义,如果当前直播的体育赛事数据中,不属于体育赛事事件,则不进行本发明后续步骤;只要当根据事件层次结构判断出当前直播的体育赛事数据为体育赛事事件,才进行后续步骤。
[0097]
本发明事件层次结构的定义,具有以下优点:1)可继承性。上层节点所有属性供下层子节点继承,并为更上一层的父节点概念服务。2)结构轻巧,便于对当前直播的体育赛事数据是否为体育赛事事件,进行快速判断。
[0098]
步骤3.2,当体育赛事直播开始时,通过体育赛事直播源实时读取到当前t时刻的实时赛事数据;其中,体育赛事直播源为视频流及赛事数据流。
[0099]
根据步骤3.1预定义的事件层次结构,判断所述实时赛事数据是否属于体育赛事事件数据,如果不是,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果是,则进一步判断所述实时赛事数据,是否满足所述赛事提取触发规则,如果不满足,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果满足,则执行步骤3.3;
[0100]
步骤3.3,采用事件抽取模型,从所述实时赛事数据中提取得到事件,表示为:事件event
t
={e
t1
,e
t2
,...,e
t11
};其中,e
t1
,e
t2
,...,e
t11
代表事件event
t
的11个事件变量,提取到的事件,采用统一规范化方式表示。
[0101]
其中:
[0102]et1
为一级事件类型变量;
[0103]et2
为二级事件类型变量;
[0104]et3
为三级事件类型变量;
[0105]et4
为赛事具体事件类型变量;
[0106]et5
为对阵双方名称变量;
[0107]et6
为当前比分变量;
[0108]et7
为事件锚点变量;
[0109]et8
为当前球员姓名变量;
[0110]et9
为当前球员所在球队名称变量;
[0111]et10
为事件简要描述变量;
[0112]et11
为事件发生时间变量;
[0113]
作为一种具体实现方式,事件event
t
可采用以下方式表示:
[0114]
event
t
={event_level1,event_level2,event_level3,match_type,two_sides,current_score,anchor,player_name_cn,team,description,time_utc}
[0115]
其中:
[0116]
event_level1,event_level2,event_level3,match_type,two_sides,current_score,anchor,player_name_cn,team,description,time_utc,这11个事件变量,分别对应e
t1
,e
t2
,...,e
t11
。
[0117]
其中:
[0118]
事件简要描述变量description,格式一般为球员加事件,如“姆巴佩进球”等。
[0119]
事件发生时间变量time_utc,为事件发生的时间,需将时间转换为utc+8。
[0120]
从所述实时赛事数据中提取得到事件的提取方法为:
[0121]
按照设定顺序排列11个事件变量的组合槽位,从第1个槽位开始,利用槽位识别技术确定当前槽位,再通过对所述实时赛事数据的分析,得到当前槽位的变量值,并向当前槽位填充相应的变量值;然后向后移动一个槽位,循环进行,直到完成对第11个槽位的填充,
得到包含11个事件变量的事件event
t
,即为提取到的事件;如果某个槽位相应的变量值不存在,则为空;
[0122]
其中,事件锚点变量的提取方法为:根据步骤3.1预定义的锚点集合,如果存在属于锚点集合的事件属性,则将该事件属性作为事件锚点;例如,锚点集合包括:特定球员姓名、乌龙球属性。则在进行事件锚点变量的提取时,如果当前实时赛事数据中,具有特定球员姓名或乌龙球描述,则将该特定球员姓名或乌龙球描述,作为本次提取到的事件的锚点。
[0123]
采用本发明提供的事件提取方法,可得到统一规范化的事件event
t
。
[0124]
步骤4,初步匹配过程:
[0125]
步骤4.1,将步骤3提取到的事件event
t
,与步骤2得到的预筛选内容索引预筛选内容索引预筛选内容索引输入到已训练完成的逻辑回归模型进行补步匹配,逻辑回归模型分别计算得到事件event
t
与预筛选内容索引的匹配得分事件event
t
与预筛选内容索引的匹配得分事件event
t
与预筛选内容索引的匹配得分
[0126]
作为一种具体实现方式,以事件event
t
与预筛选内容索引的匹配得分为例,由于事件event
t
包含11个事件变量,而预筛选内容索引包含多个内容属性标签,因此,可采用计算11个事件变量与多个内容属性标签之间的重合度,作为匹配得分也就是说,重合度越高,则匹配得分越高。
[0127]
获得匹配得分最高的前n2个预筛选内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引其中,n2<n1,由此形成初筛内容索引库b1_index;
[0128]
步骤4.2,由于每条预筛选内容索引均绑定有对应的内容id,因此,对于初筛内容索引库b1_index中的每一条预筛选内容索引,根据其绑定的内容id,查找步骤1预建立的内容库,得到对应的初步关联内容,将得到的n2个初步关联内容表示为:初步关联内容初步关联内容初步关联内容由此形成初步关联内容库;
[0129]
步骤5,事件语义扩展过程:
[0130]
步骤5.1,对事件event
t
往前进行一定时间长度的回溯,提取事件event
t
在回溯时间段内的所有前置事件,形成前置事件合集,按时间序列,依次表示为:前置事件f_event
t
(1),前置事件f_event
t
(2),...,前置事件f_event
t
(n1);其中,n1代表前置事件的总数量;
[0131]
将n1个前置事件按时间序列的排序,称为语义扩展后的前置事件合集;
[0132]
步骤5.2,判断步骤5.1得到的前置事件的总数量n1,是否达到设定数量阈值;如果未达到,则执行步骤5.3;如果达到,则执行步骤5.4;
[0133]
步骤5.3,基于体育赛事知识图谱,对步骤5.1得到的n1个前置事件进行实体扩展得到二次扩展后事件合集;
[0134]
采用二次扩展后事件合集更新步骤5.1得到的语义扩展后的前置事件合集;然后
执行步骤5.4;
[0135]
步骤5.4,设更新后的语义扩展后的前置事件合集,包括n2个按时间顺序排列的前置事件,依次提取n2个前置事件的前置事件简要描述变量description,由此得到n2个前置事件简要描述变量,依次表示为:description(1),description(2),...,description(n2),形成事件event
t
回溯时间段内重要节点的顺序简要描述,简称为事件event
t
回溯后的简要描述description(event
t
),其中,description(event
t
)={description(1),description(2),...,description(n2)};
[0136]
将步骤5.4得到的事件event
t
回溯后的简要描述description(event
t
),以及步骤4得到的初步关联内容初步关联内容初步关联内容共同输入到深度语义匹配网络;
[0137]
步骤6,深度语义匹配过程:
[0138]
步骤6.1,采用深度语义匹配网络,分别计算得到初步关联内容与简要描述description(event
t
)的匹配得分初步关联内容与简要描述description(event
t
)的匹配得分初步关联内容与简要描述description(event
t
)的匹配得分
[0139]
其中,深度语义匹配网络,可以采用多模型融合的深度语义匹配网络。
[0140]
作为一种优选方式,本步骤中,对于任意初步关联内容其中,i=1,2,...,n2,采用以下方式,得到初步关联内容与简要描述description(event
t
)的匹配得分
[0141]
分别计算得到初步关联内容与简要描述description(event
t
)的匹配程度得分score
i_match
,初步关联内容的内容时效性得分score
i_timeliness
以及初步关联内容的内容热度得分score
i_hot
,采用下式,得到最终的匹配得分
[0142][0143]
其中:α、β和γ分别代表匹配程度权重、内容热度权重和内容时效性权重。
[0144]
也就是说,本发明中,在计算初步关联内容与简要描述的最终的匹配得分时,不仅考虑内容的匹配度,同时考虑内容时效性和内容热度等,提高对匹配得分的综合全面衡量。
[0145]
更进一步的,初步关联内容与简要描述description(event
t
)的匹配程度得分score
i_match
,通过以下方式获得:
[0146]
步骤6.1.1,预建立深度语义匹配模型库;所述深度语义匹配模型库中存储多个深度语义匹配模型;例如,基于单语义文档表达的深度语义匹配模型、基于多语义文档表达的深度语义匹配模型和直接建模匹配模式的深度语义匹配模型等。
[0147]
步骤6.1.2,按照筛选规则,从所述深度语义匹配模型库中,筛选得到m个深度语义匹配模型,分别表示为:深度语义匹配模型model1,深度语义匹配模型model2,...,深度语义匹配模型modelm;
[0148]
作为一种具体实现方式,可采用以下方式,对深度语义匹配模型库中存储的多个深度语义匹配模型进行筛选,得到m个深度语义匹配模型:
[0149]
1)预先构建训练样本集;每个训练样本集包括:内容m,简要描述c1,简要描述c2,简要描述ch以及样本标签;其中,样本标签包括与内容m匹配程度最高的前b个简要描述;
[0150]
2)假设当前深度语义匹配模型库中存储d个深度语义匹配模型,针对训练样本集,每个深度语义匹配模型均得到一个匹配度指标;将匹配度指标小于设定值的深度语义匹配模型筛选掉,由此实现对深度语义匹配模型的筛选;
[0151]
其中,匹配度指标的计算方法为:
[0152]
2.1)深度语义匹配模型分别计算得到内容m与简要描述c1的匹配值,内容m与简要描述c2的匹配值,内容m与简要描述ch的匹配值;
[0153]
然后,根据匹配值,筛选得到b个与内容m匹配程度最高的简要描述;
[0154]
2.2)比较筛选得到的简要描述与样本标签中b个简要描述的重合度,得到最终的匹配度指标。
[0155]
也就是说,对深度语义匹配模型库中每个深度语义匹配模型,针对当前匹配对象的类型,得到相同类型的训练集,并采用训练集,评估得到每个深度语义匹配模型的性能指标,将性能指标达到要求的深度语义匹配模型,作为筛选得到的m个深度语义匹配模型。
[0156]
步骤6.1.3,采用深度语义匹配模型model1,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_1
;
[0157]
采用深度语义匹配模型model2,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_2
;
[0158]
依此类推
[0159]
采用深度语义匹配模型modelm,计算得到初步关联内容与简要描述description(event
t
)的匹配得分score
model_m
;
[0160]
步骤6.1.4,对匹配得分score
model_1
,score
model_2
,...,score
model_m
进行加权融合平均,得到匹配程度得分score
i_match
。
[0161]
其中,各匹配得分的权重可自定义。各匹配得分也可归一化到区间[0,1]。
[0162]
步骤6.2,获得匹配得分最高的前n3个初步关联内容,其中,n3<n2,并按得分由高到低排序,得到的n3个初步关联内容,依次称为:多模态内容多模态内容多模态内容
[0163]
步骤7,将多模态内容多模态内容多模态内容作为当前t时刻的实时赛事数据的关联内容,即时呈现。
[0164]
然后,为提高整个方法的准确性,可以将当前t时刻的关联内容作为正面实例,形成新训练样本集,将新训练样本集分别作为逻辑回归模型、深度语义匹配模型的输入,以更新逻辑回归模型、深度语义匹配模型。
[0165]
本发明提供的一种体育赛事直播的全媒体内容智能感知及关联的方法具有以下优点:
[0166]
1)提出采用事件抽取模型,从实时赛事数据中提取得到事件的方式,通过设置顺
序排列的11个事件变量的组合槽位,统一输出规范化的事件,尤其事件具有锚点事件变量,通过定义锚点,将vr空间锚点的基本思想扩展到赛事节目全媒体内容粗略比对中,锚点是实现事件标签与多模态数据内容关联的起点,能够提高全媒体内容智能感知及关联的效率;
[0167]
2)体育赛事直播过程中,从实时赛事数据中提取得到事件,以事件为对象,采用初步匹配、事件语义扩展和深度语义匹配过程,得到与事件最关联的关联内容,并将关联内容即时呈现,此种方式是本发明重要创新点。
[0168]
其中,在进行事件与内容的关联匹配时,由于事件是结构化的离散数据,不是一段文字,而需要关联的内容是多模态的,如何实现结构化的离散数据与其他多模态内容的匹配,属于本发明重要创新点。具体的,本发明采用两步骤法,一方面,采用逻辑回归模型得到与事件初步关联的多个初步关联内容;另一方面,采用事件语义扩展方式,得到当前事件回溯后的简要描述;然后,将多个初步关联内容和当前事件回溯后的简要描述均输入到深度语义匹配网络,从而对多个初步关联内容进行进一步筛选,得到与当前事件回溯后的简要描述最匹配的多个多模态内容,即代表与当前体育赛事数据最关联的多个多模态内容。
[0169]
3)另外,当前事件发生时,提供的信息量比较少,因此,本发明采用事件语义扩展步骤,将当前事件回溯n分钟,有效提升事件的丰富度,使最终得到的关联内容更加紧密;另外,如果当前事件回溯n分钟获得的前置事件数量有限,再结合知识图谱进行语义扩展,保证最终关联内容的准确性和全面性。
[0170]
因此,采用本发明提供的体育赛事直播的全媒体内容智能感知及关联的方法具有以下优点:
[0171]
本发明能够实现对体育赛事直播节目的全媒体内容智能感知及同源内容动态关联,可以快速、全面准确的从全媒体内容数据库中搜索到与当前赛事数据最为关联的关联内容,提升体育赛事直播效果。
[0172]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。