评价文本生成方法、装置及电子设备与流程

文档序号:19992966发布日期:2020-02-22 02:28阅读:124来源:国知局
评价文本生成方法、装置及电子设备与流程

本发明涉及人工智能领域,尤其是涉及一种评价文本生成方法、装置及电子设备。



背景技术:

目前,专业的家装设计网站通常配有专门的社区或论坛,主要用于企业或用户对家装搭配的室内设计效果图与相应的方案文本描述信息的自行上传分享,其目的是为了高效宣传和营销企业或用户的设计理念、家装产品和家装设计等。但在初期运营中,往往由于初始用户活跃量不足,导致企业或用户分享的方案内容不能得到足够的评价反馈,这种情况会进一步促使企业或用户的分享失去用户的关注度,甚至严重的会导致网站的分享内容质量持续下降和用户活跃量的流失,针对上述评价反馈较少在实际应用中的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明的目的在于提供一种评价文本生成方法、装置及电子设备,以缓解了现有技术中存在的由于评价反馈较少导致的问题,生成与初始的文本信息的关联程度较高的评价文本,从而有效提升了网站社区或论坛的运营效率。

第一方面,实施例提供一种评价文本生成方法,包括:获取初始的文本信息,初始的文本信息包括家装搭配方案的文本描述信息;运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量;基于预先训练好的文本生成模型根据语义特征向量生成评价文本。

在可选的实施方式中,预设语义理解模型为bert神经网络模型;运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量的步骤,包括:根据预设文本映射字典对初始的文本信息进行文本映射,得到对应的编码信息;编码信息中携带有字编码信息嵌入标识、位置编码信息嵌入标识及段落编码信息嵌入标识;基于预先训练好的bert神经网络模型对编码信息提取对应的语义信息,并基于语义信息得到语义特征向量。

在可选的实施方式中,根据预设文本映射字典对初始的文本信息进行文本映射,得到对应的编码信息的步骤,包括:根据预设文本映射字典查找初始的文本信息对应的索引信息;根据索引信息将文本信息转化为对应的编码信息。

在可选的实施方式中,方法还包括:基于attention机制将语义特征向量输入预先训练好的文本生成模型,以使预先训练好的文本生成模型输出与初始的文本信息相关的评价文本。在可选的实施方式中,文本生成模型为lstm神经网络模型;基于预先训练好的文本生成模型根据语义特征向量生成评价文本的步骤,包括:将语义特征向量输入预先训练好的lstm神经网络模型;按照预设beamsearch的最大概率输出机制对语义特征向量信息处理,得到评价文本。

在可选的实施方式中,方法应用于网站社区或论坛。

第二方面,实施例提供一种评价文本生成装置,包括:文本获取模块,用于获取初始的文本信息,初始的文本信息包括家装搭配方案的文本描述信息;语义理解模型,用于运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量;文本生成模块,用于基于预先训练好的文本生成模型根据语义特征向量生成评价文本。

在可选的实施方式中,预设语义理解模型为bert神经网络模型;语义理解模型用于:根据预设文本映射字典对初始的文本信息进行文本映射,得到对应的编码信息;编码信息中携带有字编码信息嵌入标识、位置编码信息嵌入标识及段落编码信息嵌入标识;基于预先训练好的bert神经网络模型对编码信息提取对应的语义信息,并基于语义信息得到语义特征向量。

第三方面,实施例提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现前述实施方式任一项的评价文本生成方法的步骤。

第四方面,实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行前述实施方式任一项的评价文本生成方法的步骤。

本发明提供的评价文本生成方法、装置及电子设备,首先获取包括家装搭配方案的文本描述信息初始的文本信息,运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量,基于预先训练好的文本生成模型根据语义特征向量生成评价文本。通过预先训练好的语义理解模型对初始的文本信息进行语义理解,再将进行语义理解后得到的语义特征向量输入文本生成模型,可以提高文本生成模型的识别效果,进而提高了生成的评价文本与初始的文本信息的关联程度。因此本发明生成与初始的文本信息的关联程度较高的评价文本,从而有效提升了网站社区或论坛的运营效率。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种评价文本生成方法的流程示意图;

图2为本发明实施例提供的一种具体的神经网络模型的结构示意图;

图3为本发明实施例提供的一种评价文本生成装置的结构示意图;

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

考虑到目前的家装设计社区或论坛在初期运营中,往往由于初始用户活跃量不足,导致企业或用户分享的方案内容不能得到足够的评价反馈,这种情况会进一步促使企业或用户的分享失去用户的关注度,甚至严重的会导致网站的分享内容质量持续下降和用户活跃量的流失,本发明实施例提供了一种评价文本生成方法、装置及电子设备,生成与初始的文本信息的关联程度较高的评价文本,从而有效提升了网站社区或论坛的运营效率。

为便于理解,首先对本发明实施例提供的评价文本生成方法进行详细介绍,参见图1所示的一种评价文本生成方法的流程示意图,该方法主要包括如下步骤s102至步骤s106:

步骤s102:获取初始的文本信息,初始的文本信息包括家装搭配方案的文本描述信息。

在一种实施方式中,初始的文本信息即为包含家装设计知识相关的自然语言文本信息,诸如家装设计平台或论坛上关于家装搭配方案的文本描述信息,包括中英文字符与标点字符等,家装搭配方案的文本描述信息一般包含室内空间布局的安排,搭配风格,铺装设计,水电设计和家具搭配等描述,同时有其对应的网友评价等。

步骤s104:运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量。

在一种实施方式中,语义理解模型也可以称之为语言表征模型,其目的是为了将非结构化的文本信息量化为结构化的编码信息,语义理解模型用于对初始的文本信息进行语义理解(也即语义特征提取),上述语义理解模型可以包括bert语言表征模型、word2vector,glove和gpt等。将初始的文本信息输入到预先训练好的语义理解模型中,经过一系列处理得到对应的语义特征向量。通过对初始的文本信息进行语义特征提取,可以对初始的文本信息进行语义理解,提升了后续生成的评价文本的与初始文本信息的相关性。

步骤s106:基于预先训练好的文本生成模型根据语义特征向量生成评价文本。

在一种实施方式中,文本生成模型(也即解码生成模型)用于对上述生成的语义特征向量进行解码并生成相关的文本,上述文本生成模型可以包括lstm、rnn、gru等模型。通过输入的文本信息生成与其相关的评价文本,诸如,搭配方案的文本描述信息有“购买至某家的电视柜,日式风格,没有桌腿的设计让清洁更方便,简洁的设计弱化了电视柜的存在,但储物的能力却不在话下。”则相关的评论文本可以为“日式风格的很喜欢也很流行,储物量大也实用,求楼主多推荐几款这样的电视机柜”。

本发明提供的评价文本生成方法,首先获取包括家装搭配方案的文本描述信息初始的文本信息,运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量,基于预先训练好的文本生成模型根据语义特征向量生成评价文本。通过预先训练好的语义理解模型对初始的文本信息进行语义理解,再将进行语义理解后得到的语义特征向量输入文本生成模型,可以提高文本生成模型的识别效果,进而提高了生成的评价文本与初始的文本信息的关联程度。因此本发明生成与初始的文本信息的关联程度较高的评价文本,从而有效提升了网站社区或论坛的运营效率。

为了对上述实施例进行理解,本发明实施例提供了一种语义理解模型+文本生成模型,参见图2所示的一种具体的神经网络模型的结构示意图,以预设语义理解模型为bert神经网络模型为例进行介绍,首先使用谷歌公开的12层,768个隐藏单元和12个attentionhead的预训练模型对其进行网络权重参数和偏置的调整,再对模型进行训练得到训练后的bert神经网络模型,上述步骤s104可以包括步骤1和步骤2:

步骤1,根据预设文本映射字典对初始的文本信息进行文本映射,得到对应的编码信息。

上述预设文本映射字典是根据大量的数据经过统计得到的,主要用于将普通文本内容转换为特定的编码信息,首先根据预设文本映射字典查找初始的文本信息对应的索引信息,文本映射字典中包含每个字的对应的索引信息,再根据索引信息将文本信息转化为对应的编码信息,该编码信息中携带有字编码信息嵌入标识、位置编码信息嵌入标识及段落编码信息嵌入标识。其中:

(1).字编码嵌入是对原始句子以字为单位进行分割,然后得到每个字对应的字典索引信息进行编码;如“我和你”,可以分割为“我”,“和”和“你”三个独立的字符,并在预设的字典中获得该字符的编码。

(2).位置编码是一种可训练的初始化矩阵,主要作用是将单词所处的特定位置信息编码成特征向量,这对于一词多义的处理有重要作用。

(3).段落编码嵌入在bert微调训练阶段是用于标记两个不同的段落句子,其做法是对首段字的位置标记为0,次段为1。而在最终的模型输入中,因为只有单一段落的句子输入,所以统一标记为1。

步骤2,基于预先训练好的bert神经网络模型对编码信息提取对应的语义信息,并基于语义信息得到语义特征向量。

在一种实施方式中,例如初始的文本信息输入为“购买至某家的电视柜,日式风格,没有桌腿的设计让清洁更方便,简洁的设计弱化了电视柜的存在,但储物的能力却不在话下。”通过预设的文本映射字典获得字输入编码后,输入bert模型可以在[cls]位获得相应的768维的上下文语义编码,具体可以是[1,768]的浮点数组。

为便于对上述步骤s106进行理解,以文本生成模型为lstm神经网络模型为例,上述步骤s106可以包括如下步骤(1)和步骤(2):

步骤(1),将语义特征向量输入预先训练好的lstm神经网络模型。lstm是长度为20的,隐藏神经元为512的结构,通过对网络结构的网络权重参数和偏置进行微调进行调优,从而生成与初始的文本信息适配的评价文本。参见图2所示的网络结构,基于attention机制将语义特征向量输入预先训练好的文本生成模型,attention机制可以提高神经网络处理信息的能力,从而使得生成的评价文本与初始的文本信息相关性更强。

步骤(2),按照预设beamsearch的最大概率输出机制对语义特征向量信息处理,得到评价文本。

在一种实施方式中,通过预设beamsearch的最大概率输出机制进行处理可以理解为:设定生成句子长度为l,在lstm当前神经元输出的概率最高的前n个字中,采用均匀整数分布随机选取一个字作为下一个输出神经元的输入,重复该步骤可生成k个字,剩下l-k个字采用beamsearch的方法生成概率最高的余下句子,诸如,上述参数的取值可以为:l=20,n=5,k=5,通过这种方法可以保证生成句子的多样性和内容的有效性。

对于上述评价文本生成方法,本发明实施例还提供了一种评价文本生成装置,参见图3所示的一种评价文本生成装置的结构示意图,该装置包括以下部分:

文本获取模块302,用于获取初始的文本信息,初始的文本信息包括家装搭配方案的文本描述信息;

语义理解模块304,用于运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量;

文本生成模块306,用于基于预先训练好的文本生成模型根据语义特征向量生成评价文本。

本发明提供的评价文本生成装置,首先获取包括家装搭配方案的文本描述信息初始的文本信息,运用预先训练好的语义理解模型对初始的文本信息进行语义特征提取,并得到语义特征向量,基于预先训练好的文本生成模型根据语义特征向量生成评价文本。通过预先训练好的语义理解模型对初始的文本信息进行语义理解,再将进行语义理解后得到的语义特征向量输入文本生成模型,可以提高文本生成模型的识别效果,进而提高了生成的评价文本与初始的文本信息的关联程度。因此本发明生成与初始的文本信息的关联程度较高的评价文本,从而有效提升了网站社区或论坛的运营效率。

在一种实施方式中,上述语义理解模块304,进一步用于:根据预设文本映射字典对初始的文本信息进行文本映射,得到对应的编码信息;编码信息中携带有字编码信息嵌入标识、位置编码信息嵌入标识及段落编码信息嵌入标识;基于预先训练好的bert神经网络模型对编码信息提取对应的语义信息,并基于语义信息得到语义特征向量。

在一种实施方式中,还包括文本映射模块,用于根据预设文本映射字典查找所述初始的文本信息对应的索引信息;根据所述索引信息将所述文本信息转化为对应的编码信息。

在一种实施方式中,上述装置还包括:输入模块,用于基于attention机制将语义特征向量输入预先训练好的文本生成模型,以使预先训练好的文本生成模型输出与初始的文本信息相关的评价文本。

在一种实施方式中,文本生成模型为lstm神经网络模型;上述文本生成模块306,进一步用于将语义特征向量输入预先训练好的lstm神经网络模型,按照预设beamsearch的最大概率输出机制对语义特征向量信息处理,得到评价文本。

在一种实施方式中,上述装置应用于网站社区或论坛。

本发明还提供了一种电子设备,具体的,该电子设备包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。

图4为本发明实施例提供的一种电子设备的结构示意图,该电子设备100包括:处理器40,存储器41,总线42和通信接口43,所述处理器40、通信接口43和存储器41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。

其中,存储器41可能包含高速随机存取存储器(ram,randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线42可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。

处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现成可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。

本发明实施例所提供的评价文本生成方法、装置及电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。

本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1