一种文本生成的方法及设备与流程

文档序号:21932130发布日期:2020-08-21 14:58阅读:228来源:国知局
一种文本生成的方法及设备与流程

本发明涉及计算机技术领域,尤其涉及一种文本生成的方法及设备。



背景技术:

随着生活水平的提高和信息技术的发展,网络购物及消费已成为了大众日常生活中的一部分。面对的众多购物订单,有效可信的购物体验反馈,不管对于买家、卖家还是平台都是很重要的一个环节。对于买家而言,丰富多样的用户评论可以作为丰富自己对目标对象的认识,帮助决策是否下单;对于卖家而言,有效可信的用户评论反馈越多,表明真实有效的订单数越多,可以给潜在的买家提供更多参考,提高销量;另外,对于平台而言,为客户提供更好的购物体验,也是凸显自身平台优势、超越竞争对手的有力武器。

用户订单的评论一般是由文字和图片组成的,但是由于生活节奏的加快,除非较差的购物体验外,大多数情况下会懒于去组织文字语言对购物订单进行评论,因此存在很多目标对象下的有效评论率偏低的现象。

因此根据人工智能技术在自然语言处理领域的应用,将自然语言生成应用到文本生成的场景中。但是传统自然语言生成技术也存在一定的问题,如应用场景的专业性较强,为了保障生成效果,需要定制相应模板,文本模板固定不够灵活。



技术实现要素:

本申请提供一种文本生成的方法及设备,用以提高文本生成模板的灵活性。

第一方面,本申请提供一种文本生成的方法,该方法包括:

根据用户提交的基础信息,识别用户行为特征;

根据用户行为特征,从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板;

根据用户行为特征及目标文本生成模板,生成文本信息。

在本申请中,用于生成文本信息的目标文本模板是由从候选文本字段集合中选择的目标文本字段组成的,目标文本字段是根据用户行为特征确定的,用户行为特征是根据用户上传的基础信息确定的,因此本申请中的目标文本生成模板是根据用户的基础信息进行组合的,并不是固定的,根据不同的基础信息可以组合出不同的目标文本生成模板,提升目标文本生成模板的灵活性,且根据用户行为特征和目标文本生成模板,生成文本信息,文本信息为用户对目标对象的评论,减少用户编辑时间。

在一种可能的实现方式中,用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少一种。

在本申请中,具体给出用户行为特征包括图像情感特征、订单信息特征。关键词信息特征,图像情感特征为用户提交的图像信息,根据图像信息可以解析出用户对目标对象的评价、关键词信息特征可以直观的确定出用户对目标对象的评价、订单信息特征可以确定出针对的目标对象。

在一种可能的实现方式中,若基础信息包括用户图像信息,用户行为特征包括图像情感特征;

根据用户提交的基础信息,识别用户行为特征,包括:

将用户图像信息及对应的目标对象图像信息输入到已训练的cnn(convolutionalneuralnetworks,深度卷积神经网络)-lstm(longshort-termmemory,长短时记忆网络)耦合模型中,获得由已训练的孪生网络模型输出的不同尺度的图像特征差异信息,其中目标对象图像信息是根据用户图像信息对应的订单信息确定的;

将不同尺度的图像特征差异信息输入到已训练的lstm模型中,获得已训练的lstm模型输出的用户图像信息对应的图像情感特征。

在本申请中,由于用户上传的是目标对象的图像,而确定目标文本生成模板时使用的是图像情感特征的特征向量,因此需要将图像转换成图像情感特征的特征向量,故本申请提出一种采用已训练的cnn-lstm耦合模型确定图像情感特征的技术方案,以保证准确的确定出用户提交的图像的情感特征。

在一种可能的实现方式中,根据用户行为特征从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板,包括:

将用户行为特征输入已训练的文本生成模型中,按照已训练的文本生成模型中的模板格式,根据用户行为特征与文本字段之间的匹配度,从候选文本字段集合中选择与模板格式中文本生成字段数量一致的文本生成字段;

采用viterbi(维比特)算法对选择的目标文本字段进行排序,生成至少一个候选文本生成模板;

对候选文本生成模板进行评估,选择评估结果最优的候选文本生成模板作为目标文本生成模板。

在本申请中,若想生成文本信息,先要确定目标文本生成模板,但如何确定目标文本生成模板,本申请给出具体方案:将用户行为特征输入到已训练的文本生成模型中,已训练的文本生成模型中存储有模板格式,模板格式是根据海量带有标注的用户特征数据和对应的文本信息作为训练数据训练生成的;进一步按照模板格式在候选文本字段集合中选择与用户行为特征相匹配的文本字段,并根据文本字段组成多个候选文本生成模板,并对候选文本生成模板进行评估,根据评估结果确定目标文本生成模板,确定目标文本生成模板的评分比较高,且提升目标文本生成模板的灵活性。

在一种可能的实现方式中,若用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种;

根据用户行为特征从候选文本字段集合中选择至少一个目标文本字段之前,将用户行为特征对应的特征向量进行耦合拼接处理;并

对耦合拼接处理后的特征向量进行结构化处理。

在本申请中,当用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种时,由于每个用户行为特征的特征向量都是相互独立的,而在文本生成模型中只能对自身支持的数据进行处理,因此在将用户行为特征输入到文本生成模型之前对用户行为特征对应的特征向量进行处理,转换成文本生成模型所支持的数据格式,保证文本生成模型可以根据输入的用户行为特征进行后续处理。

在一种可能的实现方式中,根据用户行为特征及目标文本生成模板,生成文本信息,包括:

根据用户行为特征在目标文本生成模板的填空单元,设置至少一个文本词;

根据文本词和目标文本生成模板中的文本字段,确定至少一个候选文本信息;

若确定多个候选文本信息,则按照语句通顺度,从多个候选文本信息中选择文本信息。

在本申请中,在确定了目标文本生成模板后,仅是确定了文本信息中的部分即文本字段,若想通过目标文本生成模板生成文本信息,还需要在目标文本生成模板的填空单元中填写文本词,在填写文本词的时候,每个填空单元可以填写多个文本词,在将每个填空单元都填写文本词后,将生成多个候选文本信息,根据语句通顺度,从多个候选文本信息中选择文本信息,此时即可以丰富文本信息,又可以保证文本信息的通顺度。

在一种可能的实现方式中,根据用户行为特征及目标文本生成模板,生成文本信息之后,若生成多个目标文本生成模板对应的文本信息,则根据目标文本生成模板和用户行为特征的匹配度,对文本信息进行排序,并按照顺序下发给用户,以便根据用户的选择结果进行展示。

在本申请中,若确定出多个文本信息,但是由用户选择展示,用户对多个文本信息进行选择展示时,由于文本信息比较多,选择比较困难,因此为用于提供文本信息的排列顺序,方便用户根据排列顺序选择文本信息进行展示。

第二方面,本申请实施例提供一种文本生成的设备,该设备包括:存储器及处理器;

存储器用于存储文本字段或程序代码;

处理器用于执行程序代码,以实现如下过程:根据用户提交的基础信息,识别用户行为特征;根据用户行为特征从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板;根据用户行为特征及目标文本生成模板,生成文本信息。

在一种可能的实现方式中,用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少一种。

在一种可能的实现方式中,若基础信息包括用户图像信息,用户行为特征包括图像情感特征;

处理器具体用于:

将用户图像信息及对应的目标对象图像信息输入到已训练的cnn-lstm耦合模型中,获得由已训练的孪生网络模型输出的不同尺度的图像特征差异信息,其中目标对象图像信息是根据用户图像信息对应的订单信息确定的;

将不同尺度的图像特征差异信息输入到已训练的lstm模型中,获得已训练的lstm模型输出的用户图像信息对应的图像情感特征。

在一种可能的实现方式中,若用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种;

处理器还用于:

将用户行为特征对应的特征向量进行耦合拼接处理;并

对耦合拼接处理后的特征向量进行结构化处理。

在一种可能的实现方式中,处理器具体用于:

将用户行为特征输入已训练的文本生成模型中,按照已训练的文本生成模型中的模板格式,根据用户行为特征与文本字段之间的匹配度,从候选文本字段集合中选择与模板格式中文本生成字段数量一致的文本生成字段;

采用viterbi算法对选择的目标文本字段进行排序,生成至少一个候选文本生成模板;

对候选文本生成模板进行评估,选择评估结果最优的候选文本生成模板作为目标文本生成模板。

在一种可能的实现方式中,处理器具体用于:

根据用户行为特征在目标文本生成模板的填空单元,设置至少一个文本词;

根据文本词和目标文本生成模板中的文本字段,确定至少一个候选文本信息;

若确定多个候选文本信息,则按照语句通顺度,从多个候选文本信息中选择文本信息。

在一种可能的实现方式中,处理器还用于:

若生成多个目标文本生成模板对应的文本信息,则根据目标文本生成模板和用户行为特征的匹配度,对文本信息进行排序,并按照顺序下发给用户,以便根据用户的选择结果进行展示。

第三方面,本申请实施例提供一种文本生成的设备,该设备包括:

识别模块,用于根据用户提交的基础信息,识别用户行为特征;

第一生成模块,用于根据用户行为特征从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板;

第二生成模块,用于根据用户行为特征及目标文本生成模板,生成文本信息。

第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令被处理器执行时实现本申请实施例提供的文本生成的方法。

本申请有益效果如下:

本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种文本生成的方法的应用场景示意图;

图2为本申请实施例提供一种文本生成的方法流程图;

图3为本申请实施例提供的终端中文本编辑界面示意图;

图4为本申请实施例提供的一种cnn-lstm耦合模型示意图;

图5为本申请实施例提供的文本信息生成的示意图;

图6为本申请实施例提供的一种文本生成的整体方法的流程图;

图7为本申请实施例提供的一种文本生成的设备的结构图;

图8为本申请实施例提供的另一种文本生成的设备的结构图。

具体实施方式

本申请实施例描述的架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。

以下对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解:

1、本申请实施例中术语“多个”是指两个或两个以上,其它量词与之类似。

2、“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

下面对本申请实施例的设计构思进行简要介绍。

随着人们生活水平的提高和信息技术的发展,网络购物及消费已成为了大众日常生活中的一部分。面对的众多购物订单,有效可信的购物体验反馈,不管对于买家、卖家还是平台都是很重要的一个环节。购物体验的反馈是根据用户对订单对应的目标对象的评论确定的。用户对订单对应的目标对象进行评论时,一般由文字和图片组成,但是由于生活节奏的加快,除非较差的购物体验外,大多数情况下会懒于去组织文字语言对购物订单进行评论,因此存在很多目标对象下的有效评论率偏低的现象。因此,探索如何实现基于图片和文本关键词的评论自动生成技术显得很有必要。

随着人工智能技术在自然语言处理领域的不断发展,自然语言生成的应用也越来越广泛。目前,自然语言生成已经成功应用到多个领域和场景,比如新闻写作、摘要生成、文本生成等。但是传统语言生成技术也存在一定的问题,比如应用场景的专业性较强,为了保障生成效果,一般需要领域专家定制相应模板,文本格式固定。

近年来,基于深度学习的自然语言生成技术得到越来越多学术界和工业界的关注。本申请中将基于神经模板的文本生成和基于图片的描述文本生成进行耦合,针对图片和评论文本关键词进行自然语言生成。

由于基于神经模板的文本生成存在可解释性和可控制性的优势,不仅能够解决人工定义模板不够丰富多变的问题,还能较好地控制生成效果,保证了生成语句的通顺流畅。基于图片的描述文本生成通过深度学习网络分析大量图片特征,可以生成相应描述图片内容的文本。

本发明旨在提供一种基于用户特征行为的评论自动生成技术。根据用户上传的目标对象的相应照片、勾选评论关键词等简单操作,即可为用户自动生成丰富流畅的评论文本。

在介绍完本申请实施例的设计思想之后,下面对本申请设置的应用场景进行简要说明。需要说明的是,以下场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。

如图1所示,为本申请实施例提供的一种文本生成的方法的应用场景示意图。服务器10通过网络与终端设备11进行通信连接。

网络可以是但不限于局域网、城域网或广域网等。

终端设备11可以是个人电脑(personalcomputer,pc)、平板电脑、个人数字助理(personaldigitalassistant,pda)、笔记本和手机等终端设备,也可以是具有移动终端设备的计算机,包括各种便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们能够向用户提供语音、数据或语音和数据连通性的设备,以及与无线接入网交换语音、数据或语音和数据。

服务器10可以是任何能够提供互联网服务,用于管理存储数据的后台运行设备。

在本应用场景中,终端设备11用于安装运行各种生活购物软件,用户可以在生活购物软件中对购买对象进行评论,在进行评论时,用户仅需将关键词信息和/或目标对象的图像信息上传到服务器10,由服务器10根据关键词信息和/或目标对象的图像信息生成评论文本,并将生成的评论文本下发到终端设备11,用户在终端设备11的显示界面中选择服务器10下发的评论文本,并将选择的评论文本上报给服务器10,由服务器10确定用户的评论文本,并将该评论文本通过终端设备11展示给其他用户。

基于上述论述的场景,对本申请实施例提供的文本生成的方法进行介绍。

如图2所示,为本申请实施例提供的一种文本生成的方法流程图,包括如下步骤:

步骤200,根据用户提交的基础信息,识别用户行为特征。

在本申请中,基础信息包括关键词信息、用户图像信息、目标对象的订单信息中的至少一种;

需要说明的是,用户图像信息是用户对目标对象进行拍摄后上传的。

相应的,用户行为特征包括有关键词信息特征、图像情感特征、订单信息特征中的至少一种。

在本申请中,基础信息中的关键词信息以及目标对象的图像信息是用户在终端的文本编辑界面中上传的。如图3所示,为终端中文本编辑界面示意图。从图3中可知,在文本编辑界面中包含有供用户选择的关键词信息,比如“好评”、“一般”、“差评”等;还有照片引导模块,用于引导用户上传目标图像的图像信息。

当用户在终端的文本编辑界面中选择了基础信息后,点击文本编辑按键,则将用户选择的基础信息上传到服务器,由服务器根据用户提交的基础信息进行文本生成。

需要说明的是,订单信息是隐藏信息,当用户选择对某个目标对象进行品论时,就可确定该目标对象对应的订单信息。

在一种可能的实现方式中,若用户提交的基础信息中包括有针对目标对象给出的关键词信息,则用户行为特征包括关键词信息特征,关键词信息特征是通过seq2seq的文本摘要生成技术实现的。

在一种可能的实现方式中,若用户提交的基础信息包括用户图像信息,则用户行为特征包括图像情感特征,其中图像情感特征是基于cnn-lstm耦合模型对用户图像信息进行图像情感提取获得的。

如图4所示,为本申请实施例提供的一种基于cnn-lstm耦合模型获取图像情感特征的示意图。

根据用户提交的信息确定用户的订单信息,根据订单信息与目标对象图像信息的对应关系,确定目标对象图像信息;需要说明的是,目标对象图像信息是商家针对目标对象存储的图像。

将用户图像信息及对应的目标对象图像信息输入到已训练的cnn-lstm耦合模型中,获得图像情感特征。

将用户图像信息和目标对象图像信息输入到已训练的cnn-lstm耦合模型中获得图像情感特征时,由于是耦合模型即由cnn模型和lstm模型两种模型组成的一种耦合模型。

因此在获取图像情感特征时:

首先,将用户图像信息和目标对象信息输入到已训练的孪生网络模型中,由孪生网络模型输出不同尺度的图像特征差异信息;

之后,将不同尺度的图像特征差异信息输入到已训练的lstm模型中,获得已训练的lstm模型输出的用户图像信息对应的图像情感特征。

其中,孪生网络模型中包括有两个相同的子网络,子网络为cnn模型。

在本申请中,已训练的cnn-lstm耦合模型是根据海量的带有标注的评论文本和对应的用户图像信息进行训练生成的。

步骤201,根据用户行为特征,从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板。

步骤202,根据用户行为特征及目标文本生成模板,生成文本信息。

在本申请中,确定了用户行为特征后,根据用户行为特征确定文本信息时,先根据用户行为特征确定目标文本生成模板;并根据目标文本生成模板和用户行为特征,生成文本信息。

在一种可能的实现方式中,通过文本生成模型根据用户行为特征生成文本信息,并输出文本信息。在本申请中,以文本生成模型为hsmm(hiddensemi-markovmodels,半隐马尔可夫模型)模型为例。

需要说明的是,hsmm模型可以学习潜在的、离散的模版,使得模板变得更有解释性和可控性,目标文本生成模板更加的灵活。

其中,本申请中的文本生成模型中的目标文本生成模板的模板格式是预先训练的,即将海量的带有标注的评论文本(比如购物体验很好,衣服颜色很图片一样,穿起来很舒服)以及该评论文本对应的用户行为特征输入到hsmm模型中对用户行为特征和评论文本的映射关系进行训练;不同的评论文本对应的句式可以各不相同。训练时,随机选取一些评论文本及对应的用户行为特征对用户行为特征和评论文本的映射关系进行训练,此时会生成固定的文本模板格式即目标文本生成模板的模板格式,比如模板格式为n个文本字段、m个标点、q个填空单元;同时还可以获取到多个候选文本字段。

将训练得到的候选文本字段和目标文本生成模板的模板格式进行存储,当再次接收到用户提交的用户行为特征后,根据用户行为特征按照已训练的文本生成模型中的目标文本生成模板的模板格式生成目标文本生成模板,最终根据用户行为特征以及目标文本生成模板生成目标文本。

在本申请中,基于已训练好的文本生成模型生成文本信息时,如下:

将用户行为特征输入已训练的文本生成模型中。

在本申请中,文本生成模型是结构化数据驱动,因此当用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种时,在将用户行文特征输入到已训练的文本生成模型中之前,需要对用户行为特征进行处理,变换成文本生成模型所支持的数据格式。

因此,在将用户行为特征输入到已训练的文本生成模型中之前,对用户行为特征对应的特征向量进行耦合拼接处理;并对耦合拼接处理后的特征向量进行结构化处理,使得输入特征是规则可控的,并且可以去除掉关键词和情感特征中相似或者重复的内容。

需要说明的是,当文本生成模型为hsmm模型时,首先将用户行为特征输入到encoder(编码器)中。

在encoder中根据用户行为特征从候选文本字段集合中选择与用户行为特征相匹配的目标文本字段,并进一步输入到viterbi算法中对encoder输出的目标文本字段推断隐状态序列,即对目标文本字段进行排列形成目标文本生成模板,此时的目标文本生成模板融合了用户提交的关键词特征和图像情感特征,最后利用生成的目标文本生成模板进行控制和引导文本的生成。

在本申请中,根据用户行为特征从候选文本字段集合中选择与用户行为特征相匹配的目标文本字段时,按照已训练的文本生成模型中的模板格式,从候选文本字段集合中选择与模板格式中文本生成字段数量一致,且与用户行为特征匹配的目标文本生成字段;

采用viterbi算法对选择的目标文本字段进行排列组合,生成至少一个候选文本生成模板;

对候选文本生成模板进行评估,选择评估结果最优的候选文本生成模板作为目标文本生成模板;

根据用户行为特征及目标文本生成模板,生成文本信息,并输出文本信息。

在本申请中,根据用户行为特征及目标文本生成模板,生成文本信息时,根据用户行为特征在目标文本生成模板的填空单元,设置至少一个文本词;

根据文本词和目标文本生成模板中的目标文本字段,确定至少一个候选文本信息;

若确定多个候选文本信息,则按照语句通顺度,从多个候选文本信息中选择文本信息。

如,生成目标文本生成模板包括:

模板1:购物体验__,衣服颜色很__,穿起来很__,强烈推荐。

此时,根据用户行为特征,对目标文本生成模板1中的填空单元填写文本词。在填写文本词时,可以采用beamsearch技术,提高文本信息的丰富性,比如设置beam=3,则填第一个填空单元的时候可以有三组词来选择,然后填第二个填空单元的时候,对第一个填空单元的三组词,都各自又有三组词选择,以此类推,此时针对目标文本生成模板1有多个句子,之后对多个句子进行打分,选择最通顺,最满意的句子。如图5所示,为本申请实施例提供的文本信息生成的示意图。

在一种可能的实现方式中,根据用户行为特征从候选文本字段集合中选择与用户行为特征相匹配的目标文本字段时,可以选择大量的与用户行为特征相匹配的目标文本字段,并将选择的所有目标文本字段输入到viterbi算法模块,采用viterbi算法根据已训练的文本生成模型中的模板格式及优化函数确定目标文本生成模板。

即确定选择出的与用户行为特征相匹配的目标文本字段是否可作为模板的一部分主要取决于优化函数,ln(y|x,θ)=ln(sum(beta*p(z));

ln(y|x,θ)表示已知用户行为特征的结构化数据,输出句子y的概率,beta是非文本字段的概率,p(z)是把z选为文本字段的概率,z表示与用户行为特征相匹配的目标文本字段。

在本申请中,根据用户行为特征及目标文本生成模板,生成文本信息之后,若生成多个目标文本生成模板对应的文本信息,则根据目标文本生成模板和用户行为特征的匹配度,对文本信息进行排序,并按照顺序下发给用户,以便根据用户的选择结果进行展示。

由于hsmm模型可以确定出多个目标文本生模板,且每个目标文本生成模板都会确定出一个最通顺的文本信息,但是要将文本信息发送给用户选择,则此时可以仅向用户发送一个评分最高的文本信息,也可以对多个文本信息进行评分,按照由高到低的评分顺序发送给用户的终端。

如图6所示,为本申请实施例提供的一种文本生成方法的整体流程图,以用户提交的基础信息包括关键词信息、订单信息和图像信息为例,该方法包括如下步骤:

步骤600,接收用户提交的基础信息;

步骤601,根据用户提交的基础信息中的关键词信息,基于seq2seq技术识别关键词信息特征,以及根据用户提交的基础信息中的图像信息,通过cnn-lstm耦合模型识别图像情感特征;

步骤602,将关键词信息特征、订单信息特征和图像情感特征对应的特征向量进行耦合拼接处理,并进行结构化处理;

步骤603,将处理后的用户行为特征输入到文本生成模型中,由文本生成模型根据用户行为特征确定目标文本生成模板,并根据目标文本生成模板生成文本信息。

基于同一发明构思,本发明实施例中还提供了一种文本生成的设备,该通信设备对应的是本发明实施例的方法,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见上述文本生成的方法的实施,重复之处不再赘述。

如图7所示,为本申请实施例提供的一种文本生成的设备700结构图,该设备包括:处理器701及存储器702;

存储器702用于存储文本字段或程序代码;

处理器701用于执行程序代码,以实现如下过程:根据用户提交的基础信息,识别用户行为特征;根据用户行为特征从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板;根据用户行为特征及目标文本生成模板,生成文本信息。

在一种可能的实现方式中,用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少一种。

在一种可能的实现方式中,若基础信息包括用户图像信息,用户行为特征包括图像情感特征;

处理器701具体用于:

将用户图像信息及对应的目标对象图像信息输入到已训练的深度卷积神经网络cnn-长短时记忆网络lstm耦合模型中,获得由已训练的孪生网络模型输出的不同尺度的图像特征差异信息,其中目标对象图像信息是根据用户图像信息对应的订单信息确定的;

将不同尺度的图像特征差异信息输入到已训练的lstm模型中,获得已训练的lstm模型输出的用户图像信息对应的情感特征信息。

在一种可能的实现方式中,若用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种;

处理器701还用于:

将用户行为特征对应的特征向量进行耦合拼接处理;并

对耦合拼接处理后的特征向量进行结构化处理。

在一种可能的实现方式中,处理器701具体用于:

将用户行为特征输入已训练的文本生成模型中,按照已训练的文本生成模型中的模板格式,从候选文本字段集合中选择与模板格式中文本生成字段数量一致,且与用户行为特征匹配的目标文本生成字段;

采用viterbi算法对选择的目标文本字段进行排列组合,生成至少一个候选文本生成模板;

对候选文本生成模板进行评估,选择评估结果最优的候选文本生成模板作为目标文本生成模板。

在一种可能的实现方式中,处理器701具体用于:

根据用户行为特征在目标文本生成模板的填空单元,设置至少一个文本词;

根据文本词和目标文本生成模板中的目标文本字段,确定至少一个候选文本信息;

若确定多个候选文本信息,则按照语句通顺度,从多个候选文本信息中选择文本信息。

在一种可能的实现方式中,处理器701还用于:

若生成多个目标文本生成模板对应的文本信息,则根据目标文本生成模板和用户行为特征的匹配度,对文本信息进行排序,并按照顺序下发给用户,以便根据用户的选择结果进行展示。

如图8所示,为本申请实施例提供的另一种文本生成的设备800结构图,该设备包括:识别模块801、第一生成模块802及第二生成模块803;

识别模块801,用于根据用户提交的基础信息,识别用户行为特征;

第一生成模块802,用于根据用户行为特征,从候选文本字段集合中选择至少一个目标文本字段,并根据目标文本字段组成目标文本生成模板;

第二生成模块803,用于根据用户行为特征及目标文本生成模板,生成文本信息。

在一种可能的实现方式中,用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少一种。

在一种可能的实现方式中,若基础信息包括用户图像信息,用户行为特征包括图像情感特征;

识别模块801具体用于:

将用户图像信息及对应的目标对象图像信息输入到已训练的深度卷积神经网络cnn-长短时记忆网络lstm耦合模型中,获得由已训练的孪生网络模型输出的不同尺度的图像特征差异信息,其中目标对象图像信息是根据用户图像信息对应的订单信息确定的;

将不同尺度的图像特征差异信息输入到已训练的lstm模型中,获得已训练的lstm模型输出的用户图像信息对应的情感特征信息。

在一种可能的实现方式中,若用户行为特征包括图像情感特征、订单信息特征、关键词信息特征中的至少两种;

第一生成模块802还用于:将用户行为特征对应的特征向量进行耦合拼接处理;并

对耦合拼接处理后的特征向量进行结构化处理。

在一种可能的实现方式中,第一生成模块802具体用于:将用户行为特征输入已训练的文本生成模型中,按照已训练的文本生成模型中的模板格式,从候选文本字段集合中选择与模板格式中文本生成字段数量一致,且与用户行为特征匹配的目标文本生成字段;

采用viterbi算法对选择的目标文本字段进行排列组合,生成至少一个候选文本生成模板;

对候选文本生成模板进行评估,选择评估结果最优的候选文本生成模板作为目标文本生成模板。

在一种可能的实现方式中,第二生成模块803具体用于:

根据用户行为特征在目标文本生成模板的填空单元,设置至少一个文本词;

根据文本词和目标文本生成模板中的目标文本字段,确定至少一个候选文本信息;

若确定多个候选文本信息,则按照语句通顺度,从多个候选文本信息中选择文本信息。

在一种可能的实现方式中,第二生成模块803还用于:

若生成多个目标文本生成模板对应的文本信息,则根据目标文本生成模板和用户行为特征的匹配度,对文本信息进行排序,并按照顺序下发给用户,以便根据用户的选择结果进行展示。

在一些可能的实施方式中,本申请提供的文本生成的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的文本生成方法中的步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请的实施方式的信息搜索生成的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。

应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品,该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序命令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的命令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1