本申请涉及网络电视直播,具体而言,涉及一种用户识别方法、装置、电子设备及非易失性存储介质。
背景技术:
1、随着直播行业的快速发展,视频内容之间的竞争越来越激烈,直播平台的盗流的情况也越来越多。由于直播内容是对外播放,如果盗流用户通过普通用户进入直播间进行观看,并将观看的内容,通过其它平台的播放软件进行播放。此时会对直播平台的内容造成严重的流失,视频内容价值下降,用户流程丢失。
2、目前的直播盗流用户识别技术是在用户投诉iptv(交互式网络电视)业务卡顿或无法观看时,平台维护人员通过人工稽核用户账号状态、历史话单记录,发现存在异常行为如同一时间请求多份码流,并以此推断该用户为直播盗流用户,或者装维或客户经理上门排障时,通过现场摸排网络线路的方式,发现用户iptv业务组网并非电信标准组网方式,而是上联私有服务器获得iptv业务码流,以此推断该用户为直播盗流用户。相关技术只能通过人工稽核话单、现场巡检等人工方式发现少量的直播单播盗流用户,无法准确全量识别盗流用户,存在直播盗流用户识别效率低下等问题。
3、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请实施例提供了一种用户识别方法、装置、电子设备及非易失性存储介质,以至少解决由于相关技术只能通过人工稽核话单、现场巡检等方式发现少量的直播单播盗流用户,无法准确全量识别盗流用户,造成的直播盗流用户识别效率低下的技术问题。
2、根据本申请实施例的一个方面,提供了一种用户识别方法,包括:对直播业务数据进行离散化处理,得到目标数据;依据目标数据中各类属性数据的信息增益值,确定目标属性,其中,信息增益值用于表征各属性对判断用户账号类别的影响程度,用户账号类别包括:直播盗流用户和非直播盗流用户;通过计算用户账号为各个用户账号类别的后验概率值,得到目标关联关系,其中,目标关联关系用于表征目标属性的属性值与用户账号类别的关联关系;依据目标关联关系,确定目标数据中各个用户账号的用户账号类别。
3、可选地,依据目标数据中各类属性数据的信息增益值,确定目标属性包括:确定目标数据中各类属性数据的信息增益值;在信息增益值大于预设增益阈值的情况下,确定信息增益值对应的属性为目标属性。
4、可选地,确定目标数据中各类属性数据的信息增益值包括:计算目标数据的第一信息熵,其中,第一信息熵用于表征目标数据对于进行用户账号类别判断所提供的信息量;分别计算目标数据中各类属性数据的第二信息熵,其中,第二信息熵用于表征目标数据中各类属性数据对于进行用户账号类别判断所提供的信息量;依据第一信息熵和第二信息熵进行计算,得到目标数据中各类属性对应的信息增益值。
5、可选地,通过计算用户账号为各个用户账号类别的后验概率值,得到目标关联关系包括:依据目标属性,获取训练样本数据,其中,训练样本数据中包括多个用户账号的多条样本数据,每条样本数据中包括目标属性和与目标属性的属性值对应的用户账号类别;基于训练样本数据,通过计算在假设目标属性的属性值序列中各属性值在不同状态的条件下,用户账号为各个用户账号类别的后验概率值对分类模型进行训练,得到目标关联关系,其中,属性值序列中包含全部的目标属性,每个目标属性的属性值的状态均包括:是和否。
6、可选地,计算后验概率值对分类模型进行训练包括:依据训练样本数据,计算各用户账号类别的先验概率值;计算在假设用户账号为各用户账号类别的条件下,目标属性的属性值序列中各属性值在不同状态下对应的似然概率值;依据先验概率值和似然概率值进行计算,得到后验概率值;依据后验概率值,预测用户账号的用户账号类别,并与训练样本数据中预存的用户账号对应的用户账号类别进行比对。
7、可选地,计算在假设用户账号为各用户账号类别的条件下,目标属性的属性值序列在各情况下对应的似然概率值包括:计算在假设用户账号为各用户账号类别的条件下,每个目标属性的属性值在各个状态下对应的候选概率值;依据候选概率值,计算得到似然概率值。
8、可选地,对直播业务数据进行离散化处理,得到目标数据包括:依据预设编码规则,将直播业务数据中各属性的属性值进行编码整合,其中,经过编码整合的各属性的属性值的状态包含:是和否。
9、根据本申请实施例的另一个方面,还提供了一种用户识别装置,包括:预处理模块,用于对直播业务数据进行离散化处理,得到目标数据;属性确定模块,用于依据目标数据中各类属性数据的信息增益值,确定目标属性,其中,信息增益值用于表征各属性对判断用户账号类别的影响程度,用户账号类别包括:直播盗流用户和非直播盗流用户;概率计算模块,用于通过计算用户账号为各个用户账号类别的后验概率值,得到目标关联关系,其中,目标关联关系用于表征目标属性的属性值与用户账号类别的关联关系;类别识别模块,用于依据目标关联关系,确定目标数据中各个用户账号的用户账号类别。
10、根据本申请实施例的又一方面,还提供了一种电子设备,电子设备包括处理器,处理器用于运行程序,其中,程序运行时执行用户识别方法。
11、根据本申请实施例的再一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的计算机程序,其中,非易失性存储介质所在设备通过运行计算机程序执行用户识别方法。
12、在本申请实施例中,采用对直播业务数据进行离散化处理,得到目标数据;依据目标数据中各类属性数据的信息增益值,确定目标属性,其中,信息增益值用于表征各属性对判断用户账号类别的影响程度,用户账号类别包括:直播盗流用户和非直播盗流用户;通过计算用户账号为各个用户账号类别的后验概率值,得到目标关联关系,其中,目标关联关系用于表征目标属性的属性值与用户账号类别的关联关系;依据目标关联关系,确定目标数据中各个用户账号的用户账号类别的方式,通过将用户的直播业务数据所表征的用户行为特征与直播盗流行为进行关联分析,依据用户行为特征与直播盗流行为之间的概率关系判断是否为直播盗流用户,达到了提高直播盗流用户识别效率的目的,进而解决了由于相关技术只能通过人工稽核话单、现场巡检等方式发现少量的直播单播盗流用户,无法准确全量识别盗流用户,造成的直播盗流用户识别效率低下技术问题。
1.一种用户识别方法,其特征在于,包括:
2.根据权利要求1所述的用户识别方法,其特征在于,依据所述目标数据中各类属性数据的信息增益值,确定目标属性包括:
3.根据权利要求2所述的用户识别方法,其特征在于,确定所述目标数据中各类属性数据的所述信息增益值包括:
4.根据权利要求1所述的用户识别方法,其特征在于,通过计算用户账号为各个所述用户账号类别的后验概率值,得到目标关联关系包括:
5.根据权利要求4所述的用户识别方法,其特征在于,计算所述后验概率值对分类模型进行训练包括:
6.根据权利要求5所述的用户识别方法,其特征在于,计算在假设用户账号为各所述用户账号类别的条件下,所述目标属性的属性值序列在各情况下对应的似然概率值包括:
7.根据权利要求1所述的用户识别方法,其特征在于,对直播业务数据进行离散化处理,得到目标数据包括:
8.一种用户识别装置,其特征在于,包括:
9.一种电子设备,所述电子设备包括处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述用户识别方法。
10.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述用户识别方法。