结合知识图谱的篮球赛事投篮事件自动分析和可视化方法与流程

文档序号:20776289发布日期:2020-05-19 20:48阅读:378来源:国知局
结合知识图谱的篮球赛事投篮事件自动分析和可视化方法与流程

本发明涉及数据可视化技术领域,具体涉及一种结合知识图谱的篮球赛事投篮事件自动分析和可视化方法。



背景技术:

在数据时代,结合新闻数据来报道新闻越来越收到媒体人的重视,传统的新闻报道方式开始逐渐向“数据新闻”转型。在新闻的众多类别中,体育新闻是受众量较多的类别之一,结合赛事数据挖掘分析和数据可视化技术来驱动报道赛事数据新闻已经成为世界各大媒体常用的体育赛事新闻报道手段。而篮球作为体育中的热门项目,结合数据可视化来开展赛事数据的研究分析是媒体重点突围的方向。

目前针对篮球赛后数据分析的体育门户和数据分析网站有很多,但其表现形式都是简单的统计数据表格化视觉呈现和赛后文字总结,分析过程中缺乏对赛事数据的深层次挖掘以及知识拓展。尤其的,在篮球背景信息拓展这一方面缺乏实践,影响了用户阅读篮球比赛和了解篮球知识的使用体验。



技术实现要素:

本发明提供了一种结合知识图谱的篮球赛事投篮事件自动分析和可视化方法,能够进行投篮命中事件可视化、优先可视化显示高能力球员的知识图谱以及使用直方图技术可视化表示比赛激烈时间段,以便用户直观了解比赛和专家分析比赛。

一种结合知识图谱的篮球赛事投篮事件自动分析和可视化方法,包括以下步骤:

1)由数据分析网站使用爬虫获取并采用html技术解析获得篮球比赛统计数据、球员的常规统计数据和投篮事件数据,采用数据清洗技术处理得到知识图谱所需要的实体;

2)从篮球比赛视频中通过识别比分板变化状态识别投篮命中事件,获取比分板变化前的最新一次投篮即为投篮命中事件,并且抽取该投篮命中事件的视频摘要;

3)基于比例构建真实篮球赛场与二维坐标系的映射,导入步骤2)得到的投篮命中事件和步骤1)爬取的投篮事件数据中的坐标数据,绘制映射图形完成可视化,得到一系列可视化的投篮命中事件;

4)对步骤3)得到的一系列可视化的投篮命中事件进行编号,以该编号为主键构建步骤1)爬取的投篮事件数据中的投篮坐标数据与步骤2)中的投篮命中事件的视频摘要的对应关系并形成摘要视频的播放路径,通过获取用户点击状态完成视频的输出显示,完成投篮命中事件可视化;

5)根据步骤1)爬取的球员的常规统计数据计算每个球员的进攻力saf、防守力sdf、活跃度sv和总评分sall,将球员的综合能力评分sall代入篮球知识图谱库进行查询,根据能力高低对球员进行排序,优先可视化显示高能力球员的知识图谱;

6)根据步骤1)爬取的投篮事件数据中投篮事件时间计算赛场热点时间段,假设投篮事件影响力半衰期参数为t1/2,第i个投篮事件时间的发生时间为τi,得分为λi,定义t时刻赛场热度h(t)为所有已经发生投篮事件在t时刻的影响力累积和:

7)根据步骤6)得到的赛场热度h(t)计算结果找到比赛激烈时间段,使用直方图技术可视化表示比赛激烈时间段,以便用户直观了解比赛和专家分析比赛。

步骤1)中,所述的知识图谱所需要的实体包括篮球赛事、双方球队实体和双方球员实体的相关信息;

所述的篮球比赛统计数据包括但不仅限于球队出场人数、总投篮命中率、总投篮命中数此类字段属性。

所述球员的常规统计数据具体包括球员姓名、是否首发、出场时间、投篮命中率、投篮命中个数、投篮出手次数、三分投篮命中率、三分投篮命中个数、三分投篮出手次数、罚球命中率、罚球命中个数、罚球出手次数、真实命中率、篮板总数、前场篮板数、后场篮板数、助攻个数、抢断个数、盖帽个数、失误个数、犯规个数以及本场得分共22个字段属性。

所述投篮事件数据包括投篮事件时间、坐标(即投篮坐标数据)、球队、投篮球员、投篮事件描述详情。

所述数据清洗技术,即数据格式检查、过滤、转换和整合,所获得数据保存于数据库中。

步骤3)中,所述的绘制映射图形采用圆点编码方案,以圆点颜色来区分投篮球队。

步骤5)中,识别比分板变化状态识别投篮命中事件采用通用的视频处理技术或人工识别实现。

根据步骤1)爬取的球员的常规统计数据计算每个球员的进攻力saf、防守力sdf、活跃度sv和总评分sall,具体包括:

令nx为统计数据中项目x的次数,x为统计数据中项目,px为统计数据中项目x的成功率(如果没有成功率数据,则默认为1),则各评分的计算公式如下:

saf=∑pm×nm-n犯规-n失误,m∈m

m={投篮数,罚球数,三分球,后场篮板,助攻}

pm为集合m中各事件m的成功率,nm为集合m中各事件m的次数,n犯规表示犯规的次数,n失误表示失误的次数;

sdf=∑nl,l∈l

l={前场篮板,后场篮板,抢断个数,盖帽}

sv=n出场×tavg

其中,nl表示集合l中各事件l的次数,tavg为每次平均上场时间,n出场表示出场次数;

定义球员的综合能力评分sall为:

sall=w1saf+w2sdf+w3sv

其中,wi为用户输入权重,wi∈[0,1],i=1,2,3,各个权重wi在运行时由用户交互式修改,代表用户对球员不同能力的侧重,从而达到根据不同条件筛选目标球员。对球员的综合能力评分进一步扩展为n条评价准则,设有n条准则,则对球员的综合能力评分sall表示为:

其中,n为评价准则的条数,wj表示第j条评价准则的权重,sj表示第j条评价准则的能力评分,w·s表示向量和矩阵内积。

步骤5)中,所述的球员的常规统计数据包括:球员投篮数据、三分球数据、罚球数据、篮板球等数据。

步骤7)中,根据步骤6)得到的赛场热度h(t)计算结果找到比赛激烈时间段,具体包括:

使用分为n个时段的等宽直方图,激烈赛事阈值为threshold,可人为设定,算法过程如下:

i=1至n;

计算时段i的平均赛事热度

ti+1表示第i+1时段的起始值,ti表示第i时段的起始值,t表示时间;

当hi>threshold,将时间段[ti,ti+1]作为激烈赛事时间段。

与现有技术相比,本发明具有如下优点:

本发明能够进行投篮命中事件可视化、优先可视化显示高能力球员的知识图谱以及使用直方图技术可视化表示比赛激烈时间段,以便用户直观了解比赛和专家分析比赛。

本发明根据投篮事件自动进行赛事激烈程度分析和激烈时段抽取将人们平时基于感觉的赛事激烈程度进行量化,结合赛场投篮事件可视化使得用户从时间和空间维度对于赛事的激烈程度可以有形象了解。同时赛事激烈程度的计算和量化包含用户可修改的参数(如影响力半衰期和激烈程度阈值等),这使得用户主观意愿可以被包含在赛事分析之内。

本发明提出的结合知识图谱数据的篮球赛事可视化方法补充了现在市面上对于篮球背景知识信息拓展可视化的不足。确定渲染实体传参获取到图谱数据完成可视化渲染,并将渲染结果作为背景知识的载入补充和知识拓展。将知识图谱技术与数据可视化技术相结合,知识图谱数据加可视化的融合视角可以帮助用户语义直观的阅读了解比赛,提升用户的使用体验。

投篮事件的短视频自动生成和可视化补充了现在市面上对于投篮事件位置数据可视化的不足。通过将真实比赛的坐标依比例与二维坐标系映射,使得用户从空间维度可以宏观的了解本场比赛球员和球队的投篮状态;投篮事件视频摘要在本方法中是对投篮事件空间维度可视化的补充,基于结合投篮事件坐标数据、二维坐标系和视频摘要的高维度融合视角帮助用户语义直观的去理解比赛。

附图说明

图1是本发明的结合知识图谱的篮球赛事投篮事件自动分析和可视化方法的流程示意图;

图2是实施例中提供的结合知识图谱数据的篮球赛事可视化方法的具体流程示意图;

图3是实施例中提供的结合知识图谱数据的篮球赛事可视化方法中针对球队实体的可视化渲染效果图。

图4是实施例中提供的结合知识图谱数据的篮球赛事可视化方法中针对球员实体的可视化渲染效果图。

图5是本实施例中提供的可视化方法针对知识更新以及渲染更新的一种交互方法流程图。

图6是实施例中提供的投篮事件和短视频生成的可视化方法的流程图。

图7是实施例中提供的投篮事件的可视化渲染效果图。

具体实施方式

为使本发明的上述目的、特征和优点更加明显易懂,下面将结合本发明实施例中的附图和具体实例对本发明实施例中的技术方案做详实的描述。显然,以下所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。

如图1所示,一种结合知识图谱的篮球赛事投篮事件自动分析和可视化方法,包括以下步骤:

1)由数据分析网站使用爬虫获取并采用html技术解析获得篮球比赛统计数据、球员的常规统计数据和投篮事件数据,采用数据清洗技术处理得到知识图谱所需要的实体;

所述的知识图谱所需要的实体包括篮球赛事、双方球队实体和双方球员实体的相关信息;

所述的篮球比赛统计数据包括但不仅限于球队出场人数、总投篮命中率、总投篮命中数此类字段属性。

所述球员的常规统计数据具体包括球员姓名、是否首发、出场时间、投篮命中率、投篮命中个数、投篮出手次数、三分投篮命中率、三分投篮命中个数、三分投篮出手次数、罚球命中率、罚球命中个数、罚球出手次数、真实命中率、篮板总数、前场篮板数、后场篮板数、助攻个数、抢断个数、盖帽个数、失误个数、犯规个数以及本场得分共22个字段属性。

所述投篮事件数据包括投篮事件时间、坐标、球队、投篮球员、投篮事件描述详情。

所述数据清洗技术,即数据格式检查、过滤、转换和整合,所获得数据保存于数据库中。

2)从篮球比赛视频中通过识别比分板变化状态识别投篮命中事件,获取比分板变化前的最新一次投篮即为投篮命中事件,并且抽取该投篮命中事件的视频摘要;

3)基于比例构建真实篮球赛场与二维坐标系的映射,导入步骤2)得到的投篮命中事件和步骤1)爬取的投篮事件数据中的坐标数据,绘制映射图形完成可视化,得到一系列可视化的投篮命中事件;

步骤3)中,所述的绘制映射图形采用圆点编码方案,以圆点颜色来区分投篮球队;

4)对步骤3)得到的一系列可视化的投篮命中事件进行编号,以该编号为主键构建步骤1)爬取的投篮事件数据中的投篮坐标数据与步骤2)中的投篮命中事件的视频摘要的对应关系并形成摘要视频的播放路径,通过获取用户点击状态完成视频的输出显示,完成投篮命中事件可视化;

5)根据步骤1)爬取的球员的常规统计数据计算每个球员的进攻力saf、防守力sdf、活跃度sv和总评分sall,将球员的综合能力评分sall代入篮球知识图谱库进行查询,根据能力高低对球员进行排序,优先可视化显示高能力球员的知识图谱;

识别比分板变化状态识别投篮命中事件采用通用的视频处理技术或人工识别实现。

根据步骤1)爬取的球员的常规统计数据计算每个球员的进攻力saf、防守力sdf、活跃度sv和总评分sall,具体包括:

令nx为统计数据中项目x的次数,x为统计数据中项目,px为统计数据中项目x的成功率(如果没有成功率数据,则默认为1),则各评分的计算公式如下:

saf=∑pm×nm-n犯规-n失误,m∈m

m={投篮数,罚球数,三分球,后场篮板,助攻}

pm为集合m中各事件m的成功率,nm为集合m中各事件m的次数,n犯规表示犯规的次数,n失误表示失误的次数;

sdf=∑nl,l∈l

l={前场篮板,后场篮板,抢断个数,盖帽}

sv=n出场×tavg

其中,nl表示集合l中各事件l的次数,tavg为每次平均上场时间,n出场表示出场次数;

定义球员的综合能力评分sall为:

sall=w1saf+w2sdf+w3sv

其中,wi为用户输入权重,wi∈[0,1],i=1,2,3,各个权重wi在运行时由用户交互式修改,代表用户对球员不同能力的侧重,从而达到根据不同条件筛选目标球员。对球员的综合能力评分进一步扩展为n条评价准则,设有n条准则,则对球员的综合能力评分sall表示为:

其中,n为评价准则的条数,wj表示第j条评价准则的权重,sj表示第j条评价准则的能力评分,w·s表示向量和矩阵内积。

所述的球员的常规统计数据包括:球员投篮数据、三分球数据、罚球数据、篮板球等数据。

6)根据步骤1)爬取的投篮事件数据中投篮事件时间计算赛场热点时间段,假设投篮事件影响力半衰期参数为t1/2,第i个投篮事件时间的发生时间为τi,得分为λi,定义t时刻赛场热度h(t)为所有已经发生投篮事件在t时刻的影响力累积和:

7)根据步骤6)得到的赛场热度h(t)计算结果找到比赛激烈时间段,使用直方图技术可视化表示比赛激烈时间段,以便用户直观了解比赛和专家分析比赛;

根据步骤6)得到的赛场热度h(t)计算结果找到比赛激烈时间段,具体包括:

使用分为n个时段的等宽直方图,激烈赛事阈值为threshold,可人为设定,算法过程如下:

i=1至n;

计算时段i的平均赛事热度

ti+1表示第i+1时段的起始值,ti表示第i时段的起始值,t表示时间;

当hi>threshold,将时间段[ti,ti+1]作为激烈赛事时间段。

实施例中提供的结合知识图谱数据的篮球赛事可视化方法的具体流程示意图如图2所示,请参阅图2,本发明提供的可视化方法,包括:

获取篮球比赛统计数据和投篮事件数据,采用数据清洗技术处理得到篮球赛事、双方球队实体和双方球员实体的相关信息;获取投篮事件的视频摘要,通过识别比分板变化状态识别投篮命中事件,即比分板变化前的最新一次投篮即为投篮命中事件;根据投篮事件的时间计算赛事激烈程度随事件的变化并抽取激烈赛事时段;基于比例构建真实篮球赛场与二维坐标系的映射,将处理过的投篮事件坐标数据导入模型中;设计可视化方案对处理过的投篮事件坐标数据绘制图形完成可视化,绘制图形采用圆点编码方案,以圆点颜色来区分投篮球队;以id为主键构建投篮事件坐标数据与事件视频摘要的对应关系并形成摘要视频的播放路径,通过获取用户点击状态完成视频的输出显示。

确定可视化组件渲染的实体,所述实体包括但不仅限于比赛球队和比赛球员,将实体作为参数传入知识图谱数据库中请求获取到基于实体查询的数据,图谱数据库包括但不仅限于开源知识图谱数据库和搭建的篮球专用图谱数据库;使用文本处理技术完成图谱数据的清洗和分析;构建图谱数据力导图可视化组件模型,将所述处理完成的图谱数据导入到模型中;在力导图可视化组件模型中,适配导入的图谱数据完成渲染;获取用户的点击状态,设计交互方式完成图谱数据以及组件渲染的更新。容易理解的是,图谱数据库中有关篮球赛事的实体多种多样,本实施例中以球员和球队作为实施实体。

具体实施时,可视化过程包括:

首先确定可视化组件渲染的组件,实体包括但不仅限于比赛球队和参赛球员,将实体作为参数请求图谱数据库,请求到的数据作为渲染的原始数据。

然后基于文本处理技术,将原始的图谱数据处理成可视化组件渲染匹配的数据,优选的,本发明提供的可视化方法针对参赛球队实体,处理完成的数据可以看到实体包括中文队名、英文队名、所属运动项目、所属赛事、所属地区、球队成立时间、球队主场馆、主场馆容纳人数、球队现任主教练、球队知名球星、球队所获荣誉、球队加入nba联盟时间、球队所在城市、球队所在部区、球队所在分区、球衣颜色共16个字段属性;针对球员实体,处理完成的数据可以看到实体包括学校、位置、年龄、身高、球衣号码、体重、球员主页地址共7个字段属性。针对投篮事件,处理后的数据包括事件id、时间、坐标、球队、球员、投篮事件描述详情。

接着将处理完成的投篮事件数据和知识图谱数据导入到可视化模型中。本发明提供的可视化方法基于比例构建真实篮球赛场与二维坐标系的映射,将处理过的投篮事件坐标数据导入模型中;优选的,本发明投篮事件可视化采用圆点编码方案,以圆点颜色来区分投篮球队;优选的,以id为主键构建投篮事件坐标数据与事件视频摘要的对应关系并形成摘要视频的播放路径,通过获取用户点击状态完成视频的输出显示。

优选的,本发明提供的可视化方法选择力导图作为图谱数据渲染组件,力导图组件以数据属性字段信息确定实体颜色,根据属性字段id映射颜色数组完成渲染图谱数据。图3是实施例提供的可视化方法对于球队实体可视化渲染后呈现的效果图。中间固定圆点为实体,四周发散圆点为实体属性。例如图3中选择了芝加哥公牛队作为图谱数据库传参实体,通过力导图可视化,用户可以清楚了解到公牛队的篮球知识背景,图谱数据可视化作为篮球知识背景载入补充是一个实用的选择。

需要说明的是,力导图是一种可视化组件渲染状态,渲染的数据特性为关系型数据。本发明提出的可视化方法只是使用了力导图这一可视化组件做为图谱数据渲染的介质。其中力导图构建过程是本领域的现有技术,本实施例在这里不做赘述。

图4是实施例提供的可视化方法对于球员实体可视化渲染后呈现的效果图。中间固定圆点为实体,四周发散圆点为实体属性。例如图4中选择了扎克·拉文作为图谱数据库传参实体,通过力导图可视化,用户可以清楚了解到扎克·拉文的背景信息,图谱数据可视化作为球员个人信息的拓展是一个实用的选择。

图5是本发明实施例中提供知识更新的一种交互方法示意图。可以理解的是,渲染数据导入到数据模型中,可视化组件的初始状态为初次导入实体的渲染效果图,如图3的公牛队的图谱数据渲染力导图。本发明提出的可视化方法中通过监听用户的点击状态获取到传参实体的更新。优选地,当用户点击力导图实体圆点时,获取用户的点击状态检测到实体数据的改变,从而改变传参实体获取更新。所述更新方式包括传参实体的改变导致请求数据的改变,完成图谱数据更新;所述更新方式包括导入到组件的图谱请求数据改变,导致组件渲染改变,完成渲染更新。

图6是本发明中将投篮事件坐标映射以后的可视化的效果图。图7是本发明集成了知识图谱和投篮短视频的投篮事件可视化的效果图。可见,本发明能够进行投篮命中事件可视化、优先可视化显示高能力球员的知识图谱以及使用直方图技术可视化表示比赛激烈时间段,以便用户直观了解比赛和专家分析比赛。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1