一种直播信息分析方法和相关装置与流程

文档序号:35915655发布日期:2023-10-30 07:31阅读:44来源:国知局
一种直播信息分析方法和相关装置与流程

本技术涉及信息处理,特别是涉及一种直播信息分析方法和相关装置。


背景技术:

1、直播是当下热门的内容传播形式之一,越来越多的直播发起者选择在多种直播平台上,通过自己的直播间向观众直播分享自己的直播内容。为了使直播发起者能够的直播内容能够被有效传播,直播平台通常会为每一个直播间都分配一定的用于直播间传播的传播资源,例如带宽资源、推送资源等,使每一个直播间都能够具有一定的曝光度。利用这一点,部分直播发起者为了使自己的直播内容能够吸引更多的观众,会针对同一直播内容开启多个直播间进行直播,从而可以获取更多的传播资源。

2、然而,这种同源直播间(即针对相同直播内容进行直播的直播间)的出现会占用大量的传播资源,从而导致其他与直播内容一一对应的直播间无法得到有效传播,进而导致直播平台整体所直播的直播内容减少,在造成传播资源浪费的同时降低了直播观众的观感。在相关技术中,为了对同源直播间进行管理,可以实时获取直播间所直播的直播信息片段,基于该片段分析多个直播间中是否存在同源直播间。

3、然而,相关技术中的直播信息分析方式对同源直播间的识别精度较差,容易对同源直播间出现漏识别的问题,导致直播平台的传播资源利用率较低,整体直播效果较差。


技术实现思路

1、为了解决上述技术问题,本技术提供了一种直播信息分析方法,能够通过多段已获取的直播信息对同源直播间进行识别,提高对于同源直播间识别的准确度。

2、本技术实施例公开了如下技术方案:

3、第一方面,本技术实施例公开了一种直播信息分析方法,所述方法包括:

4、确定目标直播间集合,所述目标直播间集合包括处于直播状态的多个直播间;

5、响应于所述目标直播间集合满足信息分析触发条件,获取所述多个直播间在历史直播时段分别对应的直播信息集合,所述目标直播间对应的直播信息集合包括多个直播信息,所述多个直播信息为目标直播间在所述历史直播时段包括的多个直播时段中分别对应的直播信息,直播信息用于表征通过直播间所直播的直播内容;

6、根据所述多个直播间分别对应的直播信息集合,确定所述多个直播间中的同源直播间,所述同源直播间为针对相同直播内容进行直播的直播间。

7、第二方面,本技术实施例公开了一种直播信息分析装置,所述装置包括第一确定单元、第一响应单元和第二确定单元:

8、所述第一确定单元,用于确定目标直播间集合,所述目标直播间集合包括处于直播状态的多个直播间;

9、所述第一响应单元,用于响应于所述目标直播间集合满足信息分析触发条件,获取所述多个直播间在历史直播时段分别对应的直播信息集合,所述目标直播间对应的直播信息集合包括多个直播信息,所述多个直播信息为目标直播间在所述历史直播时段包括的多个直播时段中分别对应的直播信息,直播信息用于表征通过直播间所直播的直播内容;

10、所述第二确定单元,用于根据所述多个直播间分别对应的直播信息集合,确定所述多个直播间中的同源直播间,所述同源直播间为针对相同直播内容进行直播的直播间。

11、在一种可能的实现方式中,所述信息分析触发条件为获取第一目标直播间在目标直播时段对应的第一直播信息,所述目标直播时段的起点为所述历史直播时段的终点,所述第一目标直播间为所述多个直播间中的任意一个;

12、所述第二确定单元具体用于:

13、将所述第一直播信息加入所述第一目标直播间对应的直播信息集合中,得到所述第一目标直播间对应的更新后的直播信息集合;

14、根据所述第一目标直播间对应的更新后的直播信息集合,以及所述多个直播间中除所述第一目标直播间外的直播间分别对应的直播信息集合,确定所述多个直播间中的同源直播间。

15、在一种可能的实现方式中,所述第二确定单元具体用于:

16、将多个第一直播间在所述目标直播时段对应的直播信息加入所述多个第一直播间分别对应的直播信息集合中,得到所述多个第一直播间分别对应的更新后的直播信息集合,所述多个第一直播间为所述多个直播间中,在目标时刻已获取对应所述目标直播时段的直播信息的直播间,所述目标时刻为获取所述第一直播信息的时刻,所述多个第一直播间包括所述第一目标直播间;

17、根据所述多个第一直播间对应的更新后的直播信息集合,以及所述多个直播间中除所述多个第一直播间外的直播间分别对应的直播信息集合,确定所述多个直播间中的同源直播间。

18、在一种可能的实现方式中,所述信息分析触发条件具体为:

19、获取所述多个直播间在所述目标直播时段分别对应的直播信息;

20、所述将所述第一直播信息加入所述第一目标直播间对应的直播信息集合中,得到所述第一目标直播间对应的更新后的直播信息集合,包括:

21、将所述多个直播间在所述目标直播时段分别对应的直播信息加入所述多个直播间分别对应的直播信息集合中,得到所述多个直播间分别对应的更新后的直播信息集合;

22、所述根据所述第一目标直播间对应的更新后的直播信息集合,以及所述多个直播间中除所述第一目标直播间外的直播间分别对应的直播信息集合,确定所述多个直播间中的同源直播间,包括:

23、根据所述多个直播间分别对应的更新后的直播信息集合,确定所述多个直播间中的同源直播间。

24、在一种可能的实现方式中,所述装置还包括第一更新单元:

25、所述第一更新单元,用于将所述历史直播时段更新为第一目标时段,所述目标时段为基于时间顺序将所述历史直播时段和所述目标直播时段进行拼接得到的时段。

26、在一种可能的实现方式中,所述装置还包括判断单元:

27、所述判断单元,用于判断所述第一目标时段的时段长度是否超过预设时段长度;

28、所述第一更新单元具体用于:

29、响应于所述第一目标时段的时段长度未超过所述预设时段长度,将所述历史直播时段更新为所述第一目标时段;

30、所述装置还包括第二响应单元和第二更新单元:

31、所述第二响应单元,用于响应于所述第一目标时段的时段长度超过所述预设时段长度,去除所述第一目标时段中以所述历史直播时段的起点为起点的第二目标时段,得到第三目标时段,所述第二目标时段的时段长度小于所述第一目标时段的时段长度,所述第三目标时段的时段长度不超过所述预设时段长度;

32、所述第二更新单元,用于将所述历史直播时段更新为所述第三目标时段。

33、在一种可能的实现方式中,所述直播信息为音频内容信息,所述音频内容信息用于表征通过直播间所直播的直播内容对应的音频内容,所述第二确定单元具体用于:

34、将所述多个直播间分别作为第二目标直播间,根据所述第二目标直播间对应的直播信息集合中的多个音频内容信息,以及所述多个音频内容信息在所述历史直播时段中分别对应的直播时段之间的时序关系,将所述多个音频内容信息进行拼接,生成所述第二目标直播间对应的待分析信息,所述待分析信息用于表征所述第二目标直播间在所述历史直播时段对应的直播内容中的音频内容;

35、确定所述多个直播间分别对应的待分析信息之间的相似度;

36、基于第二直播间和第三直播间分别对应的待分析信息之间的相似度大于相似度阈值,确定所述第二直播间和所述第三直播间为同源直播间,所述第二直播间和所述第三直播间为所述多个直播间中的任意两个直播间。

37、在一种可能的实现方式中,所述音频内容信息为音频识别文本信息,所述待分析信息为待分析文本信息,所述音频识别文本信息为通过对直播间所直播的直播内容进行语音识别得到的文本信息;

38、所述装置还包括提取单元:

39、所述提取单元,用于提取所述多个直播间分别对应的待分析文本信息中的关键词;

40、所述第二确定单元具体用于:

41、响应于所述第二直播间与所述第三直播间分别对应的待分析文本信息之间的关键词重合度大于重合度阈值,确定所述第二直播间与所述第三直播间分别对应的待分析文本信息之间的相似度,所述关键词重合度为第一关键词数量与第二关键词数量之间的比值,所述第一关键词数量为所述第二直播间与所述第三直播间分别对应的待分析文本信息之间共有的关键词数量,所述第二关键词数量为所述第二直播间与所述第三直播间分别对应的待分析文本信息中的关键词总数。

42、在一种可能的实现方式中,所述音频内容信息为音频识别文本信息,所述待分析信息为待分析文本信息,所述音频识别文本信息为通过对直播间所直播的直播内容进行语音识别得到的文本信息;

43、所述第二确定单元具体用于:

44、响应于所述第二直播间对应的待分析文本信息长度小于所述第三直播间对应的待分析文本信息长度,将所述第二直播间对应的待分析文本信息确定为第一文本信息,将所述第三直播间对应的待分析文本信息确定为第二文本信息;

45、确定所述第一文本信息和所述第二文本信息分别对应的字符组集合,目标文本信息对应的字符组集合中包括多个字符组,每个字符组由所述目标文本信息中连续i个字符构成,所述多个字符组包括所述目标文本信息中任意连续i个字符所对应的字符组,且所述多个字符组中不包括重复的字符组,i为不超过n的正整数,所述目标文本信息为所述第一文本信息和所述第二文本信息中的任意一个;

46、根据所述第一文本信息和所述第二文本信息分别对应的字符组集合中共有的字符组数量与所述第一文本信息对应的字符组集合中字符组数量的比值,确定第i阶对应的子相似度;

47、根据n阶分别对应的子相似度,确定所述第一文本信息与所述第二文本信息之间的相似度,所述n为正整数。

48、在一种可能的实现方式中,所述第二确定单元具体用于:

49、根据第i阶对应的子相似度与第i阶对应的权重,确定所述第i阶对应的子参数,所述第i阶对应的权重用于表征所述第i阶对应的子相似度对所述第一文本信息与所述第二文本信息之间相似度的影响程度;

50、将所述n阶分别对应的子参数之和确定为所述第一文本信息与所述第二文本信息之间的相似度。

51、在一种可能的实现方式中,所述第二确定单元具体用于:

52、基于所述第二直播间和所述第三直播间分别对应的待分析信息之间的相似度大于相似度阈值,向视频审核方发送所述第二直播间和所述第三直播间分别对应的标识信息,所述视频审核方用于基于所述第二直播间和所述第三直播间分别对应的视频内容信息,确定所述第二直播间和所述第三直播间是否为同源直播间,所述标识信息用于标识所对应的直播间,所述视频内容信息用于表征通过直播间所直播的直播内容对应的视频内容;

53、响应于所述视频审核方确定所述第二直播间和所述第三直播间为同源直播间,确定所述第二直播间和所述第三直播间为同源直播间。

54、在一种可能的实现方式中,所述装置还包括第三响应单元、第四响应单元和第五响应单元:

55、所述第三响应单元,用于响应于所述第二直播间和所述第三直播间分别对应的待分析信息之间的相似度大于相似度阈值,确定已生成的待复核直播间集合中是否具有第一待复核直播间集合,所述第一待复核直播间为包括所述第二直播间和/或所述第三直播间的待复核直播间集合;

56、所述第四响应单元,用于响应于具有所述第一待复核直播间集合,根据所述第二直播间和所述第三直播间对所述第一待复核直播间集合进行变更,合并为一个第二待复核直播间集合,所述第二待复核直播间集合包括所述第二直播间、所述第三直播间和所述第一待复核直播间集合中除所述第二直播间和所述第三直播间之外的直播间;

57、所述第五响应单元,用于响应于不具有所述第一待复核直播间集合,生成包括所述第二直播间和所述第三直播间的待复核直播间集合;

58、所述第二确定单元具体用于:

59、响应于目标待复核直播间集合满足复核触发条件,向所述视频审核方发送所述目标待复核直播间集合所包括直播间分别对应的标识信息,所述视频审核方具体用于根据所述目标待复核直播间集合所包括直播间分别对应的视频内容信息,确定所述目标待复核直播间集合所包括直播间是否为同源直播间,所述目标待复核直播间集合为包括所述第二直播间和所述第三直播间的待复核直播间集合。

60、在一种可能的实现方式中,所述复核触发条件包括:

61、所述目标待复核直播间集合对应的已生成时长达到第一预设时长,且所述目标待复核直播间集合中添加了新的直播间;

62、或,所述目标待复核直播间集合在第二预设时长中未添加新的直播间。

63、在一种可能的实现方式中,所述第二确定单元具体用于:

64、基于所述第二直播间和所述第三直播间分别对应的待分析信息之间的相似度大于所述相似度阈值,且所述第二直播间和所述第三直播间中存在不为合作直播模式的直播间,确定所述第二直播间和所述第三直播间为同源直播间,所述合作直播模式为通过多个对应不同直播内容的直播间展示相同直播信息的直播模式。

65、在一种可能的实现方式中,所述第一确定单元具体用于:

66、获取处于直播状态的多个初始直播间;

67、确定所述多个初始直播间分别对应的位置信息,目标初始直播间对应的位置信息用于标识所述目标初始直播间的直播方所处位置,所述直播方用于通过所述目标初始直播间直播所述目标初始直播间对应的直播内容;

68、根据所述多个初始直播间分别对应的位置信息对所述多个初始直播间进行划分,得到多个初始直播间集合,同一初始直播间集合中的任意两个初始直播间分别对应的位置信息所标识位置之间的距离不超过距离阈值,所述目标直播间集合为所述多个初始直播间集合中的任意一个,所述目标直播间集合中的多个初始直播间为所述多个直播间。

69、第三方面,本技术实施例公开了一种计算机设备,所述计算机设备包括处理器以及存储器:

70、所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;

71、所述处理器用于根据所述计算机程序中的指令执行第一方面中任意一项所述的直播信息分析方法。

72、第四方面,本技术实施例公开了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行第一方面中任意一项所述的直播信息分析方法

73、第五方面,本技术实施例公开了一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得所述计算机设备执行第一方面中任意一项所述的直播信息分析方法。

74、由上述技术方案可以看出,在识别同源直播间时,可以先确定目标直播间集合,目标直播间集合包括处于直播状态的多个直播间。响应于该目标直播间集合满足信息分析触发条件,为了能够较为全面的表征出多个直播间分别直播的直播内容,可以获取多个直播间在历史直播时段分别对应的直播信息集合,其中,目标直播间对应的直播信息集合包括多个直播信息,多个直播信息为目标直播间在历史直播时段包括的多个时段中分别对应的直播信息,直播信息用于表征通过直播间所直播的直播内容。因此,通过该直播信息集合中的多个直播信息,能够表征出在历史直播时段所包括的多个时段整体上的直播内容特点,且即使多个直播间中的同源直播间在历史直播时段中的某一时段上分别对应的直播信息之间差异较大,也能够通过与历史时段中其他时段的直播信息进行比对来降低直播信息时差带来的影响,从而在根据多个直播间分别对应的直播信息集合来识别同源直播间时,能够避免在基于单一时段的直播信息进行同源直播间分析时,由于单一时段的直播信息容易受多种因素影响导致同源直播间所对应的单一时段的直播信息内容差异较大,以及由于单一时段的直播信息对于整体直播内容的表征效果较差,从而无法准确识别出同源直播间的问题,提高了对同源直播间的识别准确度,进而可以对传播资源进行更加合理的分配。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1