文章生成方法、装置、设备及存储介质与流程

文档序号:16135093发布日期:2018-12-01 00:51阅读:189来源:国知局

本申请实施例涉及人工智能技术领域,尤其涉及一种文章生成方法、装置、设备及存储介质。

背景技术

在信息过剩的网络时代,如何及时为用户提供高质量,高热度的文章是各网络信息平台关心的焦点。目前现有的网络文章生成方法主要包括两种,一种是依赖自费体或者雇佣写手去编写高质量的文章,另一种是利用半自动化的方式去构造文章,其在文章构造过程中仍然有部分工作需要人工参与,文章生成效率较低,成本较高,并且难以及时准确地把握热点事件形成高热度的热点文章,时效性较差。



技术实现要素:

本申请实施例提供一种文章生成方法、装置、设备及存储介质,用以实现文章的自动生成,提高文章生成效率,降低人工成本。

本申请实施例第一方面提供一种文章生成方法,包括:获取目标文章以及用户对所述目标文章的评论信息;从所述目标文章的评论信息中选择一个作为目标评论信息;基于预设的摘要提取工具,提取所述目标文章的摘要内容;基于所述摘要内容和所述目标评论信息生成文章。

本申请实施例第二方面提供一种文章生成装置,包括:获取模块,用于获取目标文章以及用户对所述目标文章的评论信息;选择模块,用于从所述目标文章的评论信息中选择一个作为目标评论信息;提取模块,用于基于预设的摘要提取工具,提取所述目标文章的摘要内容;文章生成模块,用于基于所述摘要内容和所述目标评论信息生成文章。

本申请实施例第三方面提供一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面所述的方法。

本申请实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的方法。

基于以上各方面,本申请实施例通过获取目标文章以及用户对目标文章的评论信息,从目标文章的评论信息中选择一个作为目标评论信息,并基于摘要提取工具提取目标文章的摘要内容,从而基于摘要内容和目标评论信息生成文章。由于本申请实施例示基于用户的评论信息和文章的摘要内容来自动生成文章的,因而消除了文章生成过程中的人工干预,提高了文章的生成效率,降低了人工成本。另外,由于本申请实施例中可以主动获取目标文章,并根据目标文章的评论信息和摘要内容生成文章,因而,可以通过设置目标文章的获取方式来提高生成的文章的时效性。

应当理解,上述发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征,亦非用于限制本申请的范围。本公申请的其它特征将通过以下的描述变得容易理解。

附图说明

图1是本申请实施例提供的一种文章生成方法的流程图;

图2是本申请实施例提供的一种步骤s11的执行方法流程图;

图3是本申请实施例提供的一种步骤s11的执行方法流程图;

图4是本申请实施例提供的一种文章生成装置的结构示意图;

图5是本实施例提供的一种获取模块41的结构示意图;

图6是本实施例提供的一种获取模块41的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。

本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

由背景技术部分的介绍可知,现有技术在网络文章生成方面或多或少均需要人工进行参与,其人工成本较高,且文章的生成效率较低。并且由人获取信息的能力有限,常常无法及时准确的获取到当前的热点事件,因而也无法基于热点事件生成相应的热点文章,文章生成的时效性和热门程度较差。

针对现有技术存在的上述缺陷,本申请实施例提供给了一种文章生成方法,该方法通过自动获取文章,并根据文章的摘要内容,以及用户对文章的评价信息生成新的文章,从而实现了文章的自动生成,消除了文章生成过程中的人工干预,提高了文章的生成效率,降低了人工成本。并且还可以通过对具体文章获取方式进行设置,来达到获取热点文章及其评论的目的,从而基于热点文章的内容以及用户对该热点文章的评论信息,就能够及时有效的生成新的热点文章,提高了文章的时效性和热门程度。

以下将结合附图来具体描述本申请实施例的技术方案。

图1是本申请实施例提供的一种文章生成方法的流程图,该方法可以由一种文章生成装置来执行。参见图1,该方法包括步骤s11-s14:

s11、获取目标文章以及用户对所述目标文章的评论信息。

本实施例中的目标文章是指符合预设条件的文章。具体的作为目标文章需要符合什么预设条件可以根据需要进行设定,本实施例中不做限定。比如,在一种可能的设计中,目标文章可以是预先指定的网站、链接地址或者微博账号上的文章。在另一种可能的设计中,目标文章可以是包括目标关键词的文章,其中,目标关键词是指搜索频率超过预设阈值的关键词。或者在又一种可能的设计中,目标文章还可以是预设微博账号所关注的其他微博账号所发布的文章。当然上述几种可能的设计只是为了便于理解所进行的示例说明而不是唯一限定。另外,需要说明的是,本实施例中的目标文章是指一篇文章而非多篇文章。也就是说本实施例是基于一篇文章的内容以及用户对该篇文章的评论信息来生成新的文章。

另外,对于目标文章的评论信息,由于在一般的信息提供平台(如微博,新闻网站等)上在文章发布位置的下方均会提供该文章的评论板块,用户对文章的评论信息可以同文章的评论板块中获取,也就是说,本实施例中用户对于目标文章的评论信息可以从目标文章对应的评论板块中获取。当然这里仅是为了便于理解所提供的一种评论信息的获取方式,在其他设计中不排除还可以使用其他的获取方式,也就是说评论信息的具体获取方式可以根据需要或者具体场景进行设定,而不是仅局限于某一种特定的方式。

s12、从所述目标文章的评论信息中选择一个作为目标评论信息。

其中,本实施例从目标文章的评论信息中选择目标评论信息的方法可能包括如下几种:

在一种可能的设计中,可以将目标文章的所有评论信息中被点赞最多的评论信息作为目标评论信息。

在又一种可能的设计中,可以将目标文章的所有评论信息中被回复最多的评论信息作为目标评论信息。

在又一种可能的设计中,可以目标文章的评论信息输入预设的打分模型(比如,可以采用朴素贝叶斯算法训练一个用来给评论信息进行打分的打分模型)中,将对应打分分数最高的评论信息作为目标评论信息。

在又一种可能的设计中,也可以从目标文章的评论信息中随机选择一个作为目标评论信息。

当然上述几个可能的设计仅是用来示例性说明如何选择目标评论信息的,而不是对本申请的唯一限定。实际上,选择哪个或哪些评论信息作为目标评论信息可以根据需要进行设定,而不局限于又一种具体的方式。

s13、基于预设的摘要提取工具,提取所述目标文章的摘要内容。

其中,摘要提取工具是现有技术提供的一种能够提取文章摘要内容的工具,其在本实施例中的作用与现有技术类似,因此,其具体提取方法可以参照现有技术,本实施例中不再进行赘述。

s14、基于所述摘要内容和所述目标评论信息生成文章。

本实施例通过将目标文章的摘要内容和目标评论信息,输入预设的模板来生成新的文章。

本实施例通过获取目标文章以及用户对目标文章的评论信息,从目标文章的评论信息中选择一个作为目标评论信息,并基于摘要提取工具提取目标文章的摘要内容,从而基于摘要内容和目标评论信息生成文章。由于本实施例示基于用户的评论信息和文章的摘要内容来自动生成文章的,因而消除了文章生成过程中的人工干预,提高了文章的生成效率,降低了人工成本。另外,由于本实施例中可以主动获取目标文章,并根据目标文章的评论信息和摘要内容生成文章,因而,可以通过设置目标文章的获取方式来提高生成的文章的时效性。

下面结合附图对上述实施例进行进一步的优化和扩展。

图2是本申请实施例提供的一种步骤s11的执行方法流程图,如图2所示,在图1实施例的基础上,该方法包括步骤s21-s23:

s21、获取包括目标关键词的第一文章,其中所述目标关键词的搜索频率超过预设阈值。

在一种可能的设计中,可以通过对搜索引擎进行监控,获取搜索频率超过预设阈值的关键词作为目标关键词,并基于目标关键词,从数据库或者网络媒体上获取包括目标关键词的文章,即第一文章。甚至出于处理效率的考虑,本实施例在获取到上述文章之后,还可以在上述文章的标题和目标关键词之间进行相似度计算,将相似度超过预设阈值的文章作为第一文章。

在另一种可能的设计中,可以基于统计学的方法,将在文本库中出现的次数超过预设次数的关键词,作为目标关键词,进一步的,再从数据库或者网络媒体上获取包括目标关键词的文章作为第一文章。

这里需要说明的是上述两种方式,仅是为了清楚说明而列举的两种最有可能采用的方式,但是并不是所有方式。

s22、若包括所述目标关键词的第一文章中包括其他文章的链接地址,则获取所述链接地址所对应的第二文章。

举例来说,假设文章a中包括五个其他文章的链接地址,则分别加载这个五个链接地址,从而获得这五个链接地址上的文章作为第二文章。当然这里仅是示例说明而不是对本方的唯一限定。

s23、从所述第一文章和所述第二文章构成的文章集合中提取一篇文章作为目标文章,并获取用户对所述目标文章的评论信息。

其中,在一种可能的设计中,本实施例可以从第一文章和第二文章构成的文章集合中提取点击量在最高的文章作为目标文章。

在另一种可能的设计中,本实施例可以从第一文章和第二文章构成文章集合中随机提取一篇文章作为目标文章。

在又一种可能的设计中,本实施例可以从第一文章和第二文章构成的文章集合中提取被转发的次数最多的文章作为目标文章。

这里需要说明的是上述几种方式,仅是为了清楚说明而列举的最有可能采用的几种方式,但是并不是所有方式。

本实施例通过获取第一文章使得第一文章中包括搜索频率超过预设阈值的目标关键词,从第一文章中提取其他文章的链接地址,获取该些链接地址上的第二文章,从第一文章和第二文章构成的文章集合中选择一篇文章作为目标文章。本实施例能够确保提取获得的目标文章中包括热点信息,实现了及时获得热点文章(即目标文章),基于热点文章及热点文章的评论信息生成新的热点文章的目的。提高了生成的文章的热门程度。

图3是本申请实施例提供的一种步骤s11的执行方法流程图,如图3所示,在图1实施例的基础上,该方法包括步骤s31-s32:

s31、获取预设微博账号发布的文章,和/或所述预设微博账号所关注的微博账号发布的文章。

比如,可以预先设定一些自媒体或官方媒体的微博账号,采用定期获取的方式从该些微博账号上获取文章,和/或从该些微博账所关注的微博账号上获取文章。或者也可以根据预先设定的微博账号以及该些微博账号所转发的账号和/或关注的账号,建立账号列表,定期基于从账号列表中的一个或多个账号上获取文章。当然这里仅是为了清楚所做的示例说明而不是唯一限定。

s32、从获取到的所有文章中选择一个作为目标文章,并获取用户对所述目标文章的评论信息。

其中,选择目标文章的方法可以根据需要进行设定,本实施例中不做具体限定。为了便于理解,在本实施例中可以示例性的理解为从所有文章中选择一个点赞数最高,或者点击量最高,或者评论数最多的文章作为目标文章。

本实施例通过获取预设微博账号发布的文章和/或预设微博账号所关注的微博账号发布的文章,从获取到的所有文章中选择一个作为目标文章,能够有效拓宽目标文章的获取渠道,提高文章的丰富性,为生成高质量文章提供了有力保证。

图4是本申请实施例提供的一种文章生成装置的结构示意图,如图4所示,该装置40包括:

获取模块41,用于获取目标文章以及用户对所述目标文章的评论信息;

选择模块42,用于从所述目标文章的评论信息中选择一个作为目标评论信息;

提取模块43,用于基于预设的摘要提取工具,提取所述目标文章的摘要内容;

文章生成模块44,用于基于所述摘要内容和所述目标评论信息生成文章。

在一种可能的设计中,所述选择模块42,包括:

打分子模块,用于将所述目标文章的评论信息输入预设的打分模型中,将对应打分分数最高的评论信息作为目标评论信息。

本实施例通过的装置40能够用于执行图1实施例的方案,其执行方式和有益效果类似,在这里不再赘述。

图5是本实施例提供的一种获取模块41的结构示意图,如图5所示,在图4实施例的基础上,获取模块41,包括:

第一获取子模块411,用于获取包括目标关键词的第一文章,其中所述目标关键词的搜索频率超过预设阈值;

第二获取子模块412,用于在所述目标关键词的第一文章中包括其他文章的链接地址时,获取所述链接地址所对应的第二文章;

第一提取子模块413,用于从所述第一文章和所述第二文章构成的文章集合中提取一篇文章作为目标文章,并获取用户对所述目标文章的评论信息。

在一种可能的设计中,所述第一提取子模块413,具体可以用于:

从所述第一文章和所述第二文章构成的文章集合中提取点击量最高的文章作为目标文章。

本实施例提供的装置能够用于执行图2实施例的技术方案,其执行方式和有益效果类似,在这里不再赘述。

图6是本实施例提供的一种获取模块41的结构示意图,如图6所示,在图4实施例的基础上,获取模块41,包括:

第三获取子模块414,用于获取预设微博账号发布的文章,和/或所述预设微博账号所关注的微博账号发布的文章;

第二提取子模块415,用于从获取到的所有文章中选择一个作为目标文章,并获取用户对所述目标文章的评论信息。

其中,在一种可能的设计中,所述第二提取子模块415,具体可以用于:

从获取到的所有文章中选择一个点赞数最高,或者点击量最高,或者评论数最多的文章作为目标文章。

本实施例提供的装置能够用于执行图3实施例的技术方案,其执行方式和有益效果类似,在这里不再赘述。

本申请实施例还提供一种计算机设备,包括:一个或多个处理器;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。

本申请实施例还提供在一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述的方法。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1