本申请涉及信息技术、人工智能和多媒体处理领域,尤其涉及一种多媒体内容审查方法、设备、存储介质及计算机程序产品。
背景技术:
1、目前,由于网络多媒体内容的信息量大、更新速度快,而传统的内容审核方式主要依赖人工审查,审核效率低下,审核成本高昂,且容易受到审查人员主观判断的影响。同时,面对海量的网络内容,人工审查往往难以及时发现和处理所有潜在的风险。此外,随着互联网的发展,不良信息和有害内容的形式和手段也在不断变化和升级,这使得人工审查的难度进一步加大,导致传统的内容审核方法已经无法满足对潜在风险的及时识别和管理的需求。
技术实现思路
1、本申请实施例提供了一种多媒体内容审查方法、设备、存储介质及计算机程序产品,能够自动、高效、准确地从待审查多媒体内容中识别和过滤出不良信息,以便及时对潜在的舆情风险和不良内容的传播做出相应的处理。
2、本申请的至少一个实施例还提供了一种媒体内容审查方法,该方法包括:
3、构建舆情库,所述舆情库中存储有多条舆情信息,每条舆情信息包括舆情内容信息和表征该舆情内容信息是否为不良内容的舆情标识;
4、针对所述舆情库中所述舆情标识为不良内容的所述舆情内容信息,收集与各所述舆情内容信息相关的图片集并进行特征提取后构建特征库,所述特征库中存储有各所述图片集的第一特征;
5、获取待审查多媒体内容,对所述待审查多媒体内容中包含的图像进行特征提取后生成第二特征并构建内容库,所述内容库中关联存储有所述待审查多媒体内容以及所述第二特征;
6、将所述内容库中的所述第二特征与所述特征库中的所述第一特征进行相似比对,确定所述待审查多媒体内容是否为不良内容,并将确定为不良内容的所述待审查多媒体内容存储到风险库中。
7、本申请的至少一个实施例还提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当处理器执行所述计算机程序时,实现如本申请任意实施例提供的一种多媒体内容审查方法的步骤。
8、本申请的至少一个实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如本申请任意实施例提供的一种多媒体内容审查方法的步骤。
9、本申请的至少一个实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如本申请任意实施例提供的一种多媒体内容审查方法的步骤。
10、本申请的实施例提供的多媒体内容审查方法,包括准备阶段和风险识别阶段。在准备阶段中,构建舆情库,其中所述舆情库中存储有多条舆情信息,每条舆情信息包括舆情内容信息和表征该舆情内容信息是否为不良内容的舆情标识;然后针对所述舆情库中所述舆情标识为不良内容的所述舆情内容信息,收集与各所述舆情内容信息相关的图片集并进行特征提取后构建特征库,所述特征库中存储有各所述图片集的第一特征;在风险识别阶段中,获取待审查多媒体内容,对所述待审查多媒体内容中包含的图像进行特征提取后生成第二特征并构建内容库,所述内容库中关联存储有所述待审查多媒体内容以及所述第二特征;将所述内容库中的所述第二特征与所述特征库中的所述第一特征进行相似比对,确定所述待审查多媒体内容是否为不良内容,并将确定为不良内容的所述待审查多媒体内容存储到风险库中。通过上述方案能够自动、高效、准确地识别和过滤出存在不良内容的待审查多媒体内容,以便对潜在的舆情风险和不良内容的传播做出相应的处理。
11、在一些可选的实施例中,所述构建舆情库,包括:获取原始舆论信息,并提取原始舆论信息中涵盖的关键字段信息进行拼接,形成所述舆情内容信息,即得到舆情内容信息为所述原始舆论信息的核心内容;标注所述舆情内容信息是否为不良内容,形成所述舆情内容信息对应的所述舆情标识,以根据所述舆情标识实现对所述舆情内容信息是否为不良内容的归类;将相对应的所述舆情内容信息和所述舆情标识进行关联存储,得到所述舆情库。通过设置舆情标识可实现快速地从舆情库中搜索到为不良内容的舆情内容信息。
12、在一些可选的实施例中,所述针对所述舆情库中所述舆情标识为不良内容的所述舆情内容信息,收集与各所述舆情内容信息相关的图片集并进行特征提取后构建特征库,包括:收集与所述舆情库中所述舆情标识为不良内容的各所述舆情内容信息相关的图片集,每张图片的内容中至少包括人物、标识和场景中的一种元素;针对各图片集,提取所述图片集中不同元素的图像特征并进行融合,得到所述图片集的第一特征;将各所述图片集对应的所述第一特征进行存储,形成所述特征库。通过对图片集中不同元素的图像特征进行融合,使得融合得到的图片集的第一特征包含不同元素的图像特征,使得后续依据第一特征得到的分析结果更加全面、准确。
13、在一些可选的实施例中,所述获取待审查多媒体内容,对所述待审查多媒体内容中包含的图像进行特征提取后生成第二特征并构建内容库,包括:获取待审查多媒体内容;针对所述待审查多媒体内容中包含的图像,提取所述图像中各元素的图像特征并进行融合,得到所述第二特征,每张图像的内容中至少包括人物、标识和场景中的一种元素;将各所述待审查多媒体内容和对应的所述第二特征进行关联存储,形成所述内容库。通过将图像中各元素的图像特征进行融合,使得融合得到的第二特征包含该图像的各元素的图像特征,从而后续依据第二特征得到的分析结果更加全面、准确。
14、在一些可选的实施例中,所述针对所述待审查多媒体内容中包含的图像,提取所述图像中各元素的图像特征并进行融合,得到所述第二特征,包括:针对所述待审查多媒体内容中包含的图像,提取所述图像中各元素的图像特征,并采用聚类算法对提取的图像特征进行聚类,可以降低图像特征的维度;对聚类后的多个类别所对应的图像特征进行融合,得到所述第二特征,以使得到的第二特征可以包含多个类别所对应的图像特征。
15、在一些可选的实施例中,所述待审查多媒体内容为包含互联网、网络电视、ott中至少一种渠道所获取的视频节目;所述内容库中还包括节目单;所述风险库中还包括:确定为不良内容的所述待审查多媒体内容对应的节目单以及风险位置,以实现自动定位出不良内容所在节目单中的位置。
16、在一些可选的实施例中,所述方法还包括:对所述风险库中的所述待审查多媒体内容进行风险复查,以提升待审查多媒体内容的风险审查的准确性,并在确认风险属实后触发预设的风险管理操作,以实现自动风险管理操作。
1.一种多媒体内容审查方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述构建舆情库,包括:
3.根据权利要求1所述的方法,其特征在于,所述针对所述舆情库中所述舆情标识为不良内容的所述舆情内容信息,收集与各所述舆情内容信息相关的图片集并进行特征提取后构建特征库,包括:
4.根据权利要求3所述的方法,其特征在于,所述获取待审查多媒体内容,对所述待审查多媒体内容中包含的图像进行特征提取后生成第二特征并构建内容库,包括:
5.根据权利要求4所述的方法,其特征在于,所述针对所述待审查多媒体内容中包含的图像,提取所述图像中各元素的图像特征并进行融合,得到所述第二特征,包括:
6.根据权利要求4所述的方法,其特征在于,所述待审查多媒体内容为包含互联网、网络电视、ott中至少一种渠道所获取的视频节目;所述内容库中还包括节目单;所述风险库中还包括:确定为不良内容的所述待审查多媒体内容对应的节目单以及风险位置。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的一种多媒体内容审查方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的一种多媒体内容审查方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的一种多媒体内容审查方法的步骤。