本发明实施例涉及信息推荐技术领域,尤其涉及一种基于人工智能的新闻推荐方法及装置。
背景技术:
人工智能(Artificial Intelligence,AI),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
在信息快速发展的时代,随着互联网技术发展,越来越多的新闻资讯进入大众视野,随之新闻相关产品也出现在人们的日常生活中,与人们日常生活息息相关。
例如,常见的新闻相关产品有“今日头条”、“百度好看”、“手机百度资讯”等。它们主要是从各类新闻网站挖掘新闻,根据不同用户的兴趣和新闻本身热度、关注度等情况,将新闻推荐给用户。而针对极少数关注度非常高的热点话题新闻,例如“南海问题”、“奥运会”等,新闻媒体的编辑会手工做成系列新闻,推荐给用户。
但是,上述人工编辑系列新闻的方式,由于受人力成本和时间成本的限制,只能在话题层面上为用户推荐极少数的系列新闻,推荐效率很低。
技术实现要素:
本发明实施例提供一种基于人工智能的新闻推荐方法及装置,能够基于特定的新闻事件为用户推荐有关所述新闻事件后续进展的新闻,提高新闻推荐效率和精准度。
第一方面,本发明实施例提供了一种基于人工智能的新闻推荐方法,包括:
获取待推荐新闻事件;
确定所述待推荐新闻事件是否为已浏览新闻事件的后续进展新闻事件;
若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
第二方面,本发明实施例还提供了一种基于人工智能的新闻推荐装置,包括:
新闻获取模块,用于获取待推荐新闻事件;
新闻确定模块,用于确定所述待推荐新闻事件是否为已浏览新闻事件的后续进展新闻事件;
新闻推荐模块,用于若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
本发明实施例通过获取待推荐的新闻,将用户已浏览新闻的后续新闻事件推荐给用户,从而提高新闻的推荐效率和准确率。
附图说明
图1是本发明实施例一提供的一种基于人工智能的新闻推荐方法的流程图;
图2是本发明实施例二提供的一种基于人工智能的新闻推荐方法的流程图;
图3是本发明实施例三提供的一种基于人工智能的新闻推荐方法的流程图;
图4是本发明实施例四提供的一种基于人工智能的新闻推荐方法的流程图;
图5是本发明实施例五中的一种基于人工智能的新闻推荐装置的结构示意图;
图6是本发明实施例六中的一种基于人工智能的新闻推荐装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种基于人工智能的新闻推荐方法的流程图,本实施例可适用于各种新闻推荐的情况,该方法可以由本发明实施例提供的新闻推荐装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供新闻推荐功能的设备中,例如典型的是用户终端设备,可以是移动终端(例如手机)、平板电脑等,如图1所示,具体包括:
S110、获取待推荐新闻事件。
其中,新闻是通过报纸、电台、广播等传播信息的一种称谓,它可以记录社会、传播信息和反映时代特点,且每则新闻都包括标题、导语、主体、背景和结语等部分。新闻的传播方式多种多样,可以是文字、图片、声音或视频等。随着互联网技术的发展,信息更新的速度越来越快,新闻报道逐渐趋向于正在或新进发生的事实。由此,人们获取新闻的渠道和方式也趋向多样化。但是,在当下这个个性化、快节奏的时代,新闻的数量庞大,每个人的关注点也不相同,因此,当前的终端设备尤其是移动终端需要设置一种新闻推荐的功能,以满足人们获得各自感兴趣的新闻。
S120、确定所述待推荐新闻事件是否为已浏览新闻事件的后续进展新闻事件。
具体的,已浏览新闻与该新闻的后续进展新闻可以看作是一系列新闻。对于系列新闻都具有相似的特征,例如可以是标题相同或相似,或相同内容的延续报道,并且发布时间上具有先后顺序。判断待推荐的新闻是否属于已浏览新闻的系列新闻,可以将已浏览新闻的标题、正文和发布时间等分别与待推荐新闻的标题、正文和发布时间等进行对比,进而确定出待推荐新闻是否已浏览新闻的后续相关新闻报道。
S130、若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
具体的,已浏览新闻的后续进展的一系列新闻可以是与已浏览新闻标题、正文和发布时间等相关的新闻事件。当待推荐新闻的标题与已浏览新闻的标题相同或相近,正文内容也与已浏览新闻相关或为已浏览新闻的延续,且发布时间在已浏览新闻之后,则就可以将该待推荐新闻确定为用户已浏览新闻的后续新闻报道,将待推荐新闻推荐给用户,进而使用户接收到终端推荐给用户的已浏览新闻的后续进展新闻事件。
例如,2015年12月1日用户通过移动终端浏览了一则关于“大学生掏鸟被判十年”的新闻事件。2015年12月5日用户终端又获取到一则“争议:大学生掏鸟被判十年判刑是否过重”的新闻,通过比对已浏览新闻和新获取新闻的标题,发现其标题非常接近,并且两者的具体内容之间也具有延续性的特点,另外,从发布日期来看,后者明显在前者之后,因而可以确定“争议:大学生掏鸟被判十年判刑是否过重”的新闻为“大学生掏鸟被判十年”的新闻的后续进展新闻,此时将该新闻推荐给用户。
本实施例基于特定的新闻事件为用户推荐有关该特定新闻事件的后续新闻进展,从而提高新闻推荐效率和精准度。
可选的,所述获取待推荐新闻事件可以是:通过遍历待推荐新闻数据库中的待推荐新闻事件来获取待推荐新闻事件;或,若检测到待推荐新闻数据库中有新增加的新闻事件,将该新增加的新闻事件作为待推荐新闻事件。
具体的,预先建立存储新报道或即将报道的新闻事件待推荐新闻的数据库,通过定期的遍历待推荐新闻数据库获取待推荐新闻,并将待推荐新闻与用户浏览过的新闻进行匹配检测,从而确定待推荐的新闻与已浏览过的新闻是否为同一新闻的系列新闻,若是则可将该新闻作为推荐新闻,提醒用户查看;或者,遍历待推荐新闻数据库,发现有与其它新闻都不相同的新增加的新闻,在此之前没有与该新闻相关的报道,同样将该新闻作为待推荐的新闻,进一步推荐给用户,并提醒用户查看。同时若用户查看了该新增加的新闻,则该新闻也将会被作为已浏览的新闻存储到新闻数据库中,待其具有后续新闻报道时,推荐给用户。
实施例二
图2为本发明实施例二提供的一种基于人工智能的新闻推荐方法的流程图,本实施例在上述实施例的基础上进行优化,提供了优化的确定所述待推荐新闻事件是否为已浏览新闻事件的后续进展新闻事件的方法,具体是:分别提取所述已浏览新闻事件的第一特征信息和所述待推荐新闻事件的第二特征信息;根据所述第一特征信息和所述第二特征信息确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
相应的,本实施例的方法包括:
S210、获取待推荐新闻事件。
S220、分别提取所述已浏览新闻事件的第一特征信息和所述待推荐新闻事件的第二特征信息。
其中,所述特征信息可以是发布时间、标题、正文、语义和语料标注中的一种或多种。
具体的,特征信息可以是新闻事件的具体表现,它可以是发布时间、标题、正文、语义和语料标注等。通常对新闻事件的特征信息进行分析即可得知该新闻事件所涉及的主要内容,进而判断出两条新闻是否为同一系列的新闻事件。可以提取已浏览的新闻事件的发布时间、标题、正文和语义作为第一特征信息,提取待推荐新闻的发布时间、标题、正文和语义作为第二特征信息。
S230、根据所述第一特征信息和所述第二特征信息确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
具体的,将提取的作为第一特征信息的已浏览新闻的发布时间、标题、正文和语义等与作为第二特征信息的待推荐新闻的发布时间、标题、正文和语义等进行对比匹配,来判断待推荐新闻是否已浏览新闻的后续新闻进展事件。可以通过LDA模型、协调过滤模型或神经网络模型等进行计算分析,从而判断具有第二特征信息的待推荐新闻是否为已浏览新闻的后续新闻进展事件。
可选的,若所述第一特征信息和所述第二特征信息符合预设条件,则确定所述待推荐新闻事件为已浏览新闻事件的后续进展新闻事件。
其中,所述预设条件包含发布时间满足要求、标题满足要求、正文满足要求和语义满足要求中的至少一种。
具体的,若已浏览新闻的第一特征信息和待推荐新闻的第二特征信息对比匹配后,满足发布时间满足要求、标题满足要求、正文满足要求和语义满足要求等预设条件,则可确定上述待推荐新闻事件是已浏览新闻事件的后续进展新闻事件,该待推荐新闻即可推荐给用户。
如上例中,已浏览新闻为“大学生掏鸟被判十年”,并将该新闻的标题、正文、发布时间、语义和语料标注作为第一特征信息,将待推荐新闻的的标题、正文、发布时间、语义和语料标注作为第二特征信息进行对比。若待推荐新闻中包含一则“争议:大学生掏鸟被判十年判刑是否过重?”的新闻事件,且该新闻事件的标题与已浏览新闻的标题相近,发布时间在已浏览新闻之后,同时其语义和语料标注相匹配。由此即可确定“争议:大学生掏鸟被判十年判刑是否过重?”这一新闻事件是已浏览新闻事件“大学生掏鸟被判十年”的后续进展新闻事件。
S240、若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
本实施例通过采用特征信息对比,获得已浏览新闻的后续新闻事件,并将该后续新闻事件推荐给用户,从而提高新闻推荐的效率和精准度。
实施例三
图3为本发明实施例三提供的一种基于人工智能的新闻推荐方法的流程图,本实施例在上述实施例的基础上进行优化,提供了基于神经网络模型对比第一特征信息和第二特征信息,确定是否为已浏览新闻的后续进展新闻事件,具体是:将所述第一特征信息和所述第二特征信息输入神经网络模型中进行学习;根据学习结果确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
相应的,本实施例的方法包括:
S310、获取待推荐新闻事件。
S320、分别提取所述已浏览新闻事件的第一特征信息和所述待推荐新闻事件的第二特征信息。
S330、将所述第一特征信息和所述第二特征信息输入神经网络模型中进行学习。
其中,神经网络神经网络(Neural Networks,NN)是由大量的、简单的处理单元互相连接而形成的复杂网络系统,它能够反映人脑的许多基本功能,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
具体的,新闻信息的个性化推荐,已成为当前新闻推荐的主流推荐方式。将新闻的特征信息,如发布时间、标题、正文、语义和语料标注,输入到神经网络模型,其中分别将已浏览新闻的第一特征信息和待推荐新闻的第二特征信息输入神经网络模型进行学习,以便于神经网络模型对两者进行对比。即可实现智能化、个性化的新闻推荐。
S340、根据学习结果确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
具体的,输入到神经网络模型的已浏览新闻的第一特征信息和待推荐新闻的第二特征信息进行对比分析。神经网络模型对两者的特征信息,如发布时间、标题、正文、语义和语料标注,进行学习的结果可以确定出待推荐的新闻是否为已浏览新闻的后续进展新闻事件。
S350、若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
本实施例通过将特征信息输入神经网络进行学习,并根据学习的结果,确定推荐给用户的新闻,从而提高新闻推荐的效率和准确度。
在上述实施例的基础上,本发明实施例还包括神经网络模型的训练过程:
构造已知系列新闻事件的第一特征训练样本和/或已知非系列新闻事件的第二特征训练样本;其中,所述第一特征训练样本包含已知新闻事件的特征信息和对应的已知后续进展新闻事件的特征信息,所述第二特征训练样本包含已知新闻事件的特征信息和对应的已知非后续进展新闻事件的特征信息;
利用神经网络对所述第一特征训练样本和/或第二特征训练样本进行训练,得到所述神经网络模型。
其中,所述神经网络模型的输出结果满足以下条件:所述待推荐新闻为所述已浏览新闻事件的后续进展新闻事件的分值高于不为后续进展新闻事件的分值。
具体的,利用神经网络模型的学习和记忆能力,对神经网络模型的训练样本进行构造并训练。将已浏览新闻的后续发展新闻事件看作是系列新闻事件,而与已浏览新闻不相关的新闻事件看作是非系列新闻事件。首先,对神经网络模型的训练样本进行构造,且构造出的训练样本分别为已知系列新闻事件的第一特征训练样本,即让神经网络模型了解什么是已浏览新闻的系列新闻,和已知非系列新闻事件的第二特征训练样本,即让神经网络模型了解什么不是已浏览新闻的系列新闻。例如,在样本构造时,可首先自动挖掘出候选样本,即通过搜索引擎检索相似的新闻事件,再采用雷同新闻技术过滤掉雷同的新闻,构造出相似新闻的候选集合;然后再通过百度众包平台精细过滤,得出系列新闻事件。
具体的,将上述构造好的神经网络模型进行训练,可分别将第一特征训练样本即已浏览新闻的系列新闻的特征信息,和第二特征训练样本即非已浏览新闻的系列新闻的特征信息输入到神经网络模型中进行训练,最终获得能够分别出已浏览新闻的后续系列新闻的神经网络模型。
实施例四
图4为本发明实施例四提供的一种基于人工智能的新闻推荐方法的流程图,本实施例在上述实施例的基础上进行优化,提供了神经网络模型对第一特征信息和第二特征信息进行学习的具体方法,具体是:构造已知系列新闻事件的第一特征训练样本和/或已知非系列新闻事件的第二特征训练样本;利用神经网络对所述第一特征训练样本和/或第二特征训练样本进行训练,得到所述神经网络模型。
相应的,本实施例的方法包括:
S410、获取待推荐新闻事件。
S420、分别提取所述已浏览新闻事件的第一特征信息和所述待推荐新闻事件的第二特征信息。
S430、将所述第一特征信息和所述第二特征信息输入神经网络模型中进行学习。
S440、如果所述神经网络模型输出的分值高于预设分值,则确定所述待推荐新闻事件为所述已浏览新闻事件的后续进展新闻事件。
具体的,神经网络模型分别对已浏览新闻的第一特征信息和待推荐新闻的第二特征信息进行学习后,就会将学习结构输出。所输出的学习结果可以采用分值的方式来体现,例如可以将该分值范围设定为-1~1。当所输出的分值大于0时即可看作是已浏览新闻的后续新闻事件,且同时可以认位该分值越接近1,其相关度越大。
S450、若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
本实施例通过采用神经网络对新闻事件的特征信息进行学习,并判断输出的分值,确定推荐给用户的新闻,从而提高新闻推荐的效率和准确度。
在上述实施例的基础上,本发明实施例还包括神经网络模型的训练过程:
构造已知系列新闻事件的第一特征训练样本和/或已知非系列新闻事件的第二特征训练样本;其中,所述第一特征训练样本包含已知新闻事件的特征信息和对应的已知后续进展新闻事件的特征信息,所述第二特征训练样本包含已知新闻事件的特征信息和对应的已知非后续进展新闻事件的特征信息;
利用神经网络对所述第一特征训练样本和/或第二特征训练样本进行训练,得到所述神经网络模型。
其中,所述神经网络模型的输出结果满足以下条件:所述待推荐新闻为所述已浏览新闻事件的后续进展新闻事件的分值高于不为后续进展新闻事件的分值。
实施例五
图5所示为本发明实施例五提供的一种基于人工智能的新闻推荐装置的结构示意图。本实施例可适用于所有包含新闻推荐功能的装置中,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供新闻推荐的设备中,例如典型的是用户终端设备,可以是移动终端(例如手机)、平板电脑等,如图7所示,具体包括:新闻获取模块51、新闻确定模块52和新闻推荐模块53。
所述新闻获取模块51,用于获取待推荐新闻事件;
所述新闻确定模块52,用于确定所述待推荐新闻事件是否为已浏览新闻事件的后续进展新闻事件;
所述新闻推荐模块53,用于若是所述已浏览新闻事件的后续进展新闻事件,则将所述后续进展新闻事件推荐给用户。
本实施例所述新闻推荐装置用于执行上述各实施例所述的新闻推荐方法,其技术原理和产生的技术效果类似,这里不再赘述。
实施例六
图6为本发明实施例六提供的一种基于人工智能的新闻推荐装置的结构示意图。本实施例在上述实施例的基础上进行优化,优选新闻确定模块52包括:特征提取子模块521和信息确定子模块522。
具体的,所述特征提取子模块521,用于分别提取所述已浏览新闻事件的第一特征信息和所述待推荐新闻事件的第二特征信息;
所述信息确定子模块522,用于根据所述第一特征信息和所述第二特征信息确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
其中,所述特征信息包括以下至少一种:发布时间、标题、正文、语义和语料标注。
可选的,所述信息确定子模块522包括:信息学习单元5221和新闻确定单元5222。
具体的,所述信息学习单元5221,用于将所述第一特征信息和所述第二特征信息输入神经网络模型中进行学习;
所述新闻确定单元5222,用于根据学习结果确定所述待推荐新闻事件是否为所述已浏览新闻事件的后续进展新闻事件。
可选的,所述新闻确定单元5222具体用于判断所述神经网络模型输出的分值。
具体的,如果所述神经网络模型输出的分值高于预设分值,则确定所述待推荐新闻事件为所述已浏览新闻事件的后续进展新闻事件。
可选的,在上述实施例的基础上,本发明实施例提供的新闻推荐装置还包括:特征构造模块61和样本训练模块62
具体的,所述特征构造模块61,用于构造已知系列新闻事件的第一特征训练样本和/或已知非系列新闻事件的第二特征训练样本;其中,所述第一特征训练样本包含已知新闻事件的特征信息和对应的已知后续进展新闻事件的特征信息,所述第二特征训练样本包含已知新闻事件的特征信息和对应的已知非后续进展新闻事件的特征信息;
所述样本训练模块62,用于利用神经网络对所述第一特征训练样本和/或第二特征训练样本进行训练,得到所述神经网络模型。
其中,所述神经网络模型的输出结果满足的条件为:所述待推荐新闻为所述已浏览新闻事件的后续进展新闻事件的分值高于不为后续进展新闻事件的分值。
可选的,所述信息确定模块具体用于判断第一特征信息和第二特征信息是否符合预设条件。
具体的,若所述第一特征信息和所述第二特征信息符合预设条件,则确定所述待推荐新闻事件为已浏览新闻事件的后续进展新闻事件。
其中,所述预设条件包含发布时间满足要求、标题满足要求、正文满足要求和语义满足要求中的一种或多种。
可选的,所述新闻获取模块51具体用于:
遍历待推荐新闻数据库中的待推荐新闻事件;
或,若检测到待推荐新闻数据库中有新增加的新闻事件,则将所述新增加的新闻事件作为所述待推荐新闻事件。
本实施例所述新闻推荐装置用于执行上述各实施例所述的新闻推荐方法,其技术原理和产生的技术效果类似,这里不再赘述。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。