聊天语料收集方法和装置与流程

文档序号：13534208阅读：577来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本公开涉及互联网应用技术领域，特别涉及一种聊天语料收集方法和装置。

背景技术：

随着互联网应用技术的迅猛发展，聊天机器人也得到了较快发展，并期望应用于各种场景中，实现聊天机器人与用户之间的会话。

但在聊天机器人与用户之间实际所进行的会话中，往往存在着较大的障碍。例如，由于难以准确理解对话的上下文，也未记住用户喜好等因素的存在，并无法实现聊天机器人自身与用户之间顺畅、合乎常理的对话。

聊天机器人和用户之间会话障碍的存在，其原因在于无法收集到足够多领域、足够多的真实聊天语料。

现实中真实聊天语料较少，且由于隐私原因也不便于直接使用，因此，聊天语料的收集成了聊天机器人发展的瓶颈。

技术实现要素：

为了解决相关技术中存在的聊天语料难以获得，且存在隐私原因不便于直接使用的技术问题，本公开提供了一种聊天语料收集方法和装置。

一种聊天语料收集方法，其应用于智能服务系统与目标用户的会话中，所述方法包括：

智能服务系统获取目标用户对应的用户标识；

根据所述用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容；

向所述智能服务系统自身接入的会话系统推送所述会话发起内容；

所述智能服务系统通过所述会话系统进行自身与目标用户之间与所述会话发起内容相关的会话，保存所述会话中智能服务系统和目标用户各自的回复信息形成聊天语料。

一种聊天语料收集方法，其应用于智能服务系统参与会话的会话系统，所述方法包括：

会话系统对发起会话请求的用户进行目标用户选取，得到目标用户对应的用户标识；

获取智能服务系统为所述目标用户生成的会话发起内容；

通过智能服务系统与目标用户之间建立的好友关系进行所述会话发起内容的推送；

通过所述会话发起内容的推送发起所述会话系统中智能服务系统与目标用户之间的会话。

一种聊天语料收集方法，其特征在于，所述方法包括：

获取智能服务系统根据目标语料信息生成的广播消息；

通过所述智能服务系统接入的会话系统向用户广播所述智能服务系统生成的广播消息；

通过所述广播消息进行所述智能服务系统与所述用户之间的会话，所述会话中智能服务系统和用户各自的回复信息被保存形成聊天语料。

一种聊天语料收集装置，其应用于智能服务系统，所述装置包括：

目标用户标识获取模块，用于获取目标用户对应的用户标识；

内容生成模块，用于根据所述用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容；

会话发起内容推送模块，用于向所述智能服务系统自身接入的会话系统推送所述会话发起内容；

语料处理模块，用于通过所述会话系统进行智能服务系统自身与目标用户之间与所述会话发起内容相关的会话，保存所述会话中智能服务系统和目标用户各自的回复信息形成聊天语料。

一种聊天语料收集装置，其应用于智能服务系统参与会话的会话系统，所述装置包括：

目标用户选取模块，用于对发起会话请求的用户进行目标用户选取，得到目标用户对应的用户标识；

内容获取模块，用于获取智能服务系统为所述目标用户生成的会话发起内容；

内容推送模块，用于通过所述智能服务系统与目标用户之间建立的好友关系进行所述会话发起内容的推送；

会话发起模块，用于通过所述会话发起内容的推送发起所述会话系统中智能服务系统与目标用户之间的会话。

一种聊天语料收集装置，所述装置包括：

广播获取模块，用于获取智能服务系统根据目标语料信息生成的广播消息；

广播模块，用于通过所述智能服务系统接入的会话系统向用户广播所述智能服务系统生成的广播消息；

会话处理模块，用于通过所述广播消息进行所述智能服务系统与所述用户之间的会话，所述会话中智能服务系统和用户各自的回复信息被保存形成聊天语料。

本公开的实施例提供的技术方案可以包括以下有益效果：

在进行的聊天语料收集中，智能服务系统将获取目标用户对应的用户标识，根据用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容，向智能服务系统自身接入的会话系统推送会话发起内容，通过会话发起内容发起智能服务系统与目标用户之间的会话，智能服务系统通过会话系统进行自身与目标用户之间的会话，保存会话中智能服务系统和目标用户各自的回复信息形成聊天语料，在此聊天语料的收集中，由于是通过众多用户的参与来实现的，即通过众包的方式来解决智能服务系统的聊天语料收集问题，因此能够广泛获得聊天语料，得以实现聊天语料的轻易获得，并且也不会由于隐私原因而不便于使用。

另一方面的，由于此聊天语料的收集是基于用户画集信息和目标语料信息实现的，因此对于聊天语料收集过程中所进行的会话而言，将是有目标的真实会话过程，由此所获得的聊天语料将是与目的智能服务系统所需要的聊天语料相符合的，并且也反映了真实的会话过程，能够最大限度地提升机器人的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并于说明书一起用于解释本发明的原理。

图1是根据本公开所涉及的实施环境的示意图；

图2是根据一示例性实施例示出的一种装置的框图；

图3是根据一示例性实施例示出的一种聊天语料收集方法应用于智能服务系统的流程图；

图4是图3对应实施例的根据用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容步骤的流程图；

图5是图3对应实施例的智能服务系统通过会话系统进行自身与目标用户之间与会话发起内容相关的会话，保存会话中智能服务系统和目标用户各自的回复信息形成聊天语料步骤的流程图；

图6是根据一示例性实施例示出的智能服务系统处理用户回复信息，并通过语义检索得到个性化回复信息的流程框图；

图7是根据一示例性实施例示出的一种聊天语料收集方法应用于会话系统的流程图；

图8是图7对应实施例的会话系统对发起会话请求的用户进行目标用户选取，得到目标用户对应的用户标识步骤的流程图；

图9是根据一示例性实施例示出的一种聊天语料收集方法应用于用户终端的流程图；

图10是图9对应实施例的通过会话发起内容发起会话系统中用户自身与智能服务系统之间的会话，在会话中，根据智能服务系统的会话发起内容或个性化回复信息通过会话系统向智能服务系统返回用户回复信息步骤的流程图；

图11是根据一示例性实施例示出的用户通过漂流瓶插件实现的聊天语料收集框架的示意图；

图12是根据一示例性实施例示出的匿名会话系统的会话流程图；

图13是根据一示例性实施例示出的匿名会话系统的工作过程的流程图；

图14是根据另一示例性实施例示出的一种聊天语料收集方法的流程图；

图15是图14对应实施例示出的通过广播消息进行智能服务系统与用户之间的会话，并保存会话中智能服务系统和用户各自的回复信息形成聊天语料步骤的流程图；

图16是根据一示例性实施例示出的一种聊天语料收集装置用于机器端的框图；

图17是图16对应实施例的内容生成模块的框图；

图18是图16对应实施例的语料处理模块的框图；

图19是根据一示例性实施例示出的一种聊天语料收集装置用于会话系统的框图；

图20是图19对应实施例的目标用户选取模块的框图；

图21是根据一示例性实施例示出的一种聊天语料收集装置应用于用户终端的框图；

图22是图21对应实施例的聊天回复模块的框图；

图23是根据另一示例性实施例示出的一种聊天语料收集装置的框图；

图24是图23对应实施例示出的会话处理模块的框图。

具体实施方式

这里将详细地对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据本公开所涉及的实施环境的示意图。该实施环境包括：智能服务系统110、会话系统130和用户终端150。

智能服务系统110和用户终端150都接入会话系统130，以实现智能服务系统110和用户终端150之间的会话。

图2是根据一示例性实施例示出的一种装置200的框图。例如，装置200可以是图1所示实现环境中的智能服务系统和会话系统。智能服务系统比如可以是一运行了机器人软件的服务器。会话系统是一用以实现会话功能的服务器或者服务器集群。

参照图2，装置200可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器（centralprocessingunits，cpu）222（例如，一个或一个以上处理器）和存储器232，一个或一个以上存储应用程序242或数据244的存储介质230（例如一个或一个以上海量存储设备）。其中，存储器232和存储介质230可以是短暂存储或持久存储。存储在存储介质230的程序可以包括一个或一个以上模块（图示未示出），每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器222可以设置为与存储介质230通信，在服务器200上执行存储介质230中的一系列指令操作。服务器200还可以包括一个或一个以上电源226，一个或一个以上有线或无线网络接口250，一个或一个以上输入输出接口258，和/或，一个或一个以上操作系统241，例如windowsservertm，macosxtm，unixtm,linuxtm，freebsdtm等等。下述图3、图4、图5、图7、图8、图9、图10、图14和图15所示实施例中所述的由服务器所执行的步骤可以基于该图2所示的服务器结构。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

图3是根据一示例性实施例示出的一种聊天语料收集方法的流程图。该聊天语料收集方法用于图1所示实施环境的智能服务系统110，如图3所示，该聊天语料收集方法，可以由智能服务系统110执行，可以包括以下步骤。

在步骤310中，智能服务系统获取目标用户对应的用户标识。

其中，智能服务系统是指运行了聊天机器人软件，具备对话功能的机器。目标用户是即将与智能服务系统进行会话的用户，此目标用户可以在众多用户中选取得到。

在步骤330中，根据用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容。

其中，用户标识用以唯一标识用户身份。用户画像信息至少包括用户属性等信息，每一用户都存在着其用户标识所唯一对应的用户画像信息。该用户画集信息用于表征用户在各方面的情况，进而通过信息的形式来对用户进行描绘。

目标语料信息将是智能服务系统根据所需要的聊天语料内容预先设置的。在一个示例性实施例中，目标语料信息可以是目标语料类型，例如，该目标语料类型可以是体育类型的，也可以是美食类型的。

智能服务系统根据用户画像信息和目标语料信息进行会话发起内容的生成。由此可知，所生成的会话发起内容是与用户画集信息和目标语料信息相匹配的。

一方面，通过此方式生成的会话发起内容，由于是与目标用户的情况相符的，因此，提高后续会话发起内容推送的有效性，即由于后续向目标用户所推送的会话发起内容能够引起目标用户的共鸣或者兴趣，因此，极大程度地提高了后续收到用户回复的可能性，因此，通过此方式生成的会话发起内容将有助力于推动聊天语料的收集。

另一方面，通过此方式生成的会话发起内容，由于是与目标语料信息相符的，因此，将保证了最终收集到的聊天语料是智能服务系统的真实所需，进而能够实现针对性的聊天语料收集。

在步骤350中，向智能服务系统自身接入的会话系统推送会话发起内容。

其中，首先需要说明的是，会话系统是能够一个具备了会话功能的系统，其可实现用户与用户之间，甚至于用户与智能服务系统之间的会话。在一个示例性实施例中，此会话系统可以是匿名会话系统。

会话系统接入了众多用户，而为了实现智能服务系统的语料收集，智能服务系统也将接入到会话系统中。

智能服务系统针对目标用户生成的会话发起内容将用于开始进行智能服务系统与目标用户之间的会话。

具体的，智能服务系统将自身生成的会话发起内容推送到会话系统中，以会话系统作为中转来将会话发起内容推送到目标用户所在的终端，由此便发起了智能服务系统与目标用户之间的会话。

在步骤370中，智能服务系统通过会话系统进行自身与目标用户之间与会话发起内容相关的会话，保存会话中智能服务系统和目标用户各自的回复信息形成聊天语料。

其中，随着会话的持续进行，回复信息中存在着智能服务系统对目标用户的回复信息，即智能服务系统生成并向目标用户返回的个性化回复信息；也存在着目标用户根据智能服务系统的个性化回复信息发送的用户回复信息。因此，回复信息包括个性化回复信息和用户回复信息。

在会话系统的作用下，智能服务系统与目标用户进行会话。此时，对于智能服务系统而言，将不断接收到目标用户的用户回复信息，也不断根据目标用户的用户回复信息生成个性化回复信息，并发送给目标用户。

会话发起内容、目标用户的用户回复信息和智能服务系统的个性化回复信息便根据各自的时间顺序构成了智能服务系统和目标用户之间对话的上下文，即聊天记录，此聊天记录便可作为智能服务系统的聊天语料。

通过如上所述的过程，实现了智能服务系统和目标用户之间的会话，进而由此会话实现智能服务系统的聊天语料收集，其中，由于会话系统中存在着众多用户，因此，可选取多个用户作为目标用户，进而实现智能服务系统与多个目标用户之间的会话，进而快速实现聊天语料的收集，有效提高了聊天语料的收集效率。

在此需要特别指出的是，所指的会话发起内容和回复信息，其可以是文本形式，但并不仅限于此，也可以是语音形式，还可以是图片形式的。

根据一示例性实施例示出的步骤310的细节进行的描述中，步骤310可以包括以下步骤。

智能服务系统接收会话系统通过进行目标用户选取而向智能服务系统自身返回的用户标识，用户标识对应于目标用户。

其中，会话系统将时行目标用户的选取，在完成了目标用户的选取之后，向智能服务系统返回目标用户对应的用户标识。

智能服务系统接收到会话系统所返回的用户标识即可向此用户标识对应的目标用户进行聊天语料收集。

通过此方式，使得智能服务系统得以借助于会话系统实现自身的聊天语料收集，进而方便收集到足够多领域、足够多的真实聊天语料。

图4是根据一示例性实施例示出的对步骤330的细节进行的描述。如图4所示，该步骤330，可以包括以下步骤。

在步骤331中，根据用户标识提取用户画像信息。

其中，如前所述的，用户画像信息至少包括了用户属性信息，例如，用户所在的城市、性别和年龄等。用户画像信息是以用户标识为索引进行存储的。

因此，在获得会话系统所返回的目标用户对应的用户标识之后，将根据用户标识进行用户画像信息的查找，并提取此用户标识对应的用户画像信息。

在步骤333中，生成与目标语料信息相关，且与用户画像信息相匹配的会话发起内容。

其中，进行会话发起内容的动态生成，以获得目标语料信息所相关的，用户画像信息匹配的会话发起内容，而并不会使用固定不定的会话发起内容，进而提高了聊天语料收集的自适应性。

例如，对于年龄在35岁以下的女性目标用户，则生成情感、工作方面的会话发起内容。

又例如，预设的目标语料信息包括美食类型和体育类型，即期望收集与美食相关的聊天语料以及与体育相关的聊天语料。

此时，对于用户画像信息指示为女性的目标用户，生成与美食相关的会话发起内容；对于用户画像信息指示为男性的目标用户，生成与体育相关的会话发起内容。

图5是根据一示例性实施例示出的对步骤370的细节进行的描述。如图5所示，该步骤370，可以包括以下步骤。

在步骤371中，在通过会话发起内容发起的智能服务系统自身与目标用户之间与会话发起内容相关的会话中，智能服务系统通过会话系统接收目标用户根据会话发起内容或智能服务系统生成的个性化回复信息返回的用户回复信息。

其中，在智能服务系统和目标用户所持续进行的会话中，智能服务系统将接收到目标用户返回的用户回复信息，该用户回复信息是对应于会话发起内容或者个性化回复信息的。

在步骤373中，智能服务系统生成用户回复信息对应的个性化回复信息，并通过会话系统向目标用户返回。

其中，智能服务系统将对用户回复信息进行处理和语义检索，以生成此用户回复信息对应的个性化回复信息。

具体的，图6是根据一示例性实施例示出的智能服务系统处理用户回复信息，并通过语义检索得到个性化回复信息的流程框图。

如图6所示的，智能服务系统在接收到目标用户通过会话系统返回的用户回复信息之后，首先对用户回复信息进行处理，即执行步骤410，具体包括query（检索的关键词）分析411、query推理413和意图识别415，由此方可使用所得到的处理结果执行语义检索，即步骤420，以便于检索得到用户回复信息的答案。

其中，query分析是指对用户回复信息进行分词、同义词扩展和无意义词过滤等处理过程；query推理则是判断用户回复信息是不是否定句、疑问句等基本的判断，其过程可通过关键词匹配的方式实现；意图识别则是判断用户回复信息的类别、领域等，此过程可通过预置的规则和分类器实现，此预置的规则是正则表达式的模板，将尝试进行这些正则表达式模板的匹配，而分类器则是通过机器学习方法训练好的模型。

在完成了用户回复信息的处理，即步骤410之后，会执行语义检测步骤，即步骤420，在对话知识库中查找对应的答案，此查找得到的答案可能是多条答案，此时，将对每一条答案进行打分和排序，以最终得到打分最高的答案，使用此答案进行个性化回复，执行步骤430，即生成个性化回复信息，并向目标用户返回。

而在此过程的实现中用户画像信息、用户行为、对话管理和上下文管理所构成的数据模块450将作为支撑，以保证对话的连贯性。

在步骤375中，用户回复信息和个性化回复信息被依次保存，形成智能服务系统和目标用户之间会话的聊天语料，存储聊天语料。

其中，按照一定时间顺序依次获得的用户回复信息和个性化回复信息将被依次保存，形成完整的聊天记录，此聊天记录即可作为聊天语料进行存储。

图7是根据一示例性实施例示出的一种聊天语料收集方法的流程图。该聊天语料收集方法的流程图用于图1所示实施环境的会话系统130。如图7所示，该聊天语料收集方法，可以由会话系统110执行，可以包括以下步骤。

在步骤610中，会话系统对发起会话请求的用户进行目标用户选取，得到目标用户对应的用户标识。

其中，会话请求是指用户通过其终端向会话终端发起的。例如，在匿名会话系统中，用户可触发调用匿名会话插件，通过匿名会话插件中预置按钮的触发来发起会话请求，其中会话请求中携带了用户标识。

对于会话系统，其所接收到的会话请求将分别来自于多个用户，换而言之，多个用户都向会话系统发起了会话请求。

此时，会话系统可在这些用户中进行目标用户的选取。

在步骤630中，获取智能服务系统为目标用户生成的会话发起内容。

其中，在完成了目标用户的选取之后，会话系统向智能服务系统提供目标用户对应的用户标识，以便于从智能服务系统获得每一目标用户的会话发起内容。

在步骤650中，通过智能服务系统与目标用户之间建立的好友关系进行会话发起内容的推送。

其中，会话系统将进行会话发起内容的推送，即将智能服务系统所动态生成的会话发起内容分别推送给相应的目标用户。

而通过会话系统所实现的智能服务系统向目标用户的会话发起内容推送将是基于智能服务系统与目标用户之间建立的好友关系实现的。也就是说，在此过程中，智能服务系统是与目标用户建立了好友关系的。

在步骤670中，通过会话发起内容的推送发起会话系统中智能服务系统与目标用户之间的会话。

通过如上所述的过程，便实现了会话终端中智能服务系统与目标用户的会话，甚至于智能服务系统与大量目标用户的会话，进而在较大用户范围内进行聊天语料收集。换而言之，利用会话终端，将聊天语料的收集任务分配给众多的目标用户，让众多目标用户参与进来，进而一方面不需要再顾及隐私原因，另一方面由于是通过智能服务系统接入会话系统实现的，因此也极大地降低了成本。

在此需要说明的是，由于无论何种会话系统，智能服务系统均可根据实际运营的需要接入，以实现其聊天语料收集，因此，本公开所提供的方案具有非常高的通用性，能够适配于各种场景下的聊天语料收集，进而打破了现有聊天语料收集的困境。

图8是根据一示例性实施例示出的对步骤610的细节进行的描述。如图8所示，该聊天语料收集方法，可以包括以下步骤。

在步骤611中，在开启进行聊天语料收集时，对发起会话请求的用户判断该用户此次是否与智能服务系统进行会话，若为是，则执行步骤613，若为否，则执行步骤615。

其中，会话系统中配置了聊天语料收集开关，以便于根据项目需要选择打开或者关闭，在此聊天语料收集开关打开时，即可开启进行聊天语料收集。

在开启进行聊天语料收集时，如果接收到会话请求，便判断这一发起会话请求的用户此次是否将其与智能服务系统匹配，即进行与机器人的会话，如果判断为是，就将这一用户作为目标用户，如果判断为否，则执行这一用户与其他用户的会话流程。

具体的，判断用户此次是否与机器人进行会话的过程可通过预先设置的标准实现。其中，预先设置的标准包括但不限于：

（1）避免用户短时间内重复进行自身与智能服务系统的会话，以避免骚扰用户；

（2）根据目标语料信息和用户画像信息进行用户中目标用户的选取。

例如，在一时间段内，用户只会与智能服务系统进行一次会话；

又例如，如果希望收集有关女性用户的聊天语料，则不会选择男性用户作为目标用户，而只会选择女性用户作为目标用户。

在步骤613中，将用户作为目标用户，获取目标用户对应的用户标识。

在步骤615中，进行会话系统中与其他用户的会话流程。

通过如上所述的过程，实现了适用于聊天语料收集的目标用户选取，进而为后续所进行的聊天语料精准收集提供了极大便利。

根据一示例性实施例示出的一种聊天语料收集方法中，还可以包括以下步骤。

会话系统分别更新智能服务系统对应的好友关系和目标用户对应的好友关系，通过好友关系的更新建立智能服务系统和目标用户之间的好友关系。

其中，会话系统均存储了智能服务系统对应的好友关系和目标用户对应的好友关系。在一个实例性实施例中，智能服务系统对应的好友关系可以是列表的形式，即智能服务系统对应的好友列表；与之相对应的，目标用户对应的好友关系也可以是列表的形式，即目标用户对应的好友列表。

对智能服务系统所进行的好友关系更新是将目标用户的用户标识添加至其好友列表的过程，对目标用户所进行的好友关系也与此相类似。

由此便在会话系统中建立了智能服务系统和目标用户之间的好友状态，在此基础上即可进行会话系统中智能服务系统与目标用户之间的会话。

图9是根据一示例性实施例示出的一种聊天语料收集方法的流程。该聊天语料收集方法用于图1所示实施环境的用户终端150。如图9所示，该聊天语料收集方法，可以由用户终端150执行，可以包括以下步骤。

在步骤710中，通过自身调用的匿名会话插件向会话系统发起会话请求。

其中，在一示例性实施例中，所指的会话系统是匿名会话系统。用户终端150配置了匿名会话插件。该匿名会话插件用于使用用户终端能够接入匿名会话系统，以实现用户在匿名会话系统中的会话请求发起以及后续的会话。

具体的，通过调用匿名会话插件即可进入匿名会话页面，在此匿名会话页面中即可通过一定按钮的触发来向匿名会话系统发起会话请求。

在步骤730中，接收会话系统通过建立用户自身与智能服务系统之间的好友关系而推送的会话发起内容。

其中，在用户被选取为聊天语料收集的目标用户时，将会接收到会话系统返回的，由智能服务系统动态生成的会话发起内容。

在步骤750中，通过会话发起内容发起会话系统中用户自身与智能服务系统之间的会话，在会话中，根据智能服务系统的会话发起内容或个性化回复信息通过会话系统向智能服务系统返回用户回复信息。

其中，在调用匿名会话插件而跳转进入的匿名会话页面中，可对会话发起内容或智能服务系统根据目标用户的回复而返回的个性化回复信息进行回复，以返回会话发起内容或个性化回复信息对应的用户回复信息。

通过如上所述的过程，便实现了基于用户终端的聊天语料收集，此过程无异于真实的会话过程，即对应目标用户而言，就是一个真实的聊天场景，因此，保证了聊天语料的真实性。

根据一示例性实施例示出的一种聊天语料收集方法，还可以包括以下步骤。

通过自身调用的匿名会话插件进行会话发起内容或个性化回复信息的展示。

其中，对于用户终端调用的匿名会话插件，将在接收到会话系统返回的会话发起内容或者个性化回复信息时，通过其自身跳转进入的匿名会话页面进行会话发起内容或者个性化回复信息的展示，以便于用户查找并回复。

图10是根据一示例性实施例示出的对步骤750的细节进行的描述。如图10所示，该步骤750，可以包括以下步骤。

在步骤751中，在通过会话发起内容发起会话系统中用户自身与智能服务系统之间的会话中，通过调用的匿名会话插件获取与智能服务系统的会话发起内容或个性化回复内容对应的用户回复信息。

其中，通过匿名会话插件的匿名会话页面即可获得输入的用户回复信息，其是对应于智能服务系统的会话发起内容或者个性化回复内容的，并且可以是文体信息，也可以是语音信息，甚至于图片信息。

在步骤753中，通过会话系统向智能服务系统返回用户回复信息。

以用户终端为智能手机，会话系统为匿名会话系统为例，结合具体应用场景，描述该聊天语料收集方法。其中，对应于匿名会话系统，智能手机中所配置的匿名会话插件为漂流瓶插件。

图11示是根据一示例性实施例示出的用户通过漂流瓶插件实现的聊天语料收集框架。

在此框架下，通过匿名会话系统实现了瓶子池810，该瓶子池存储了各种会话发起内容，该会话发起内容可以是来自于其他用户的，也可以是来自于智能服务系统820。

用户通过调用漂流瓶插件所发起的捡瓶子过程来发起会话请求；智能服务系统820也通过调用自身配置的漂流瓶插件发起的丢瓶子过程将为用户动态生成的会话发起内容发送至匿名会话系统的瓶子池810中，进而由瓶子池810发送给用户。

由此便实现了智能服务系统820和用户的会话。

在具体实现中，智能服务系统和用户通过漂流瓶插件在匿名会话系统所实现的会话都必遵循匿名会话系统原本的流程。

图12是根据一示例性实施例示出的匿名会话系统的会话流程。需要特别指出的是，匿名会话系统中，对丢瓶子和捡瓶子都分别设置了一定的配额，以限制用户所能够丢瓶子的次数和捡瓶子的次数。而所指的漂流瓶索引910即为图11所示瓶子池810的具体实现。

对于图12所示的用户进行丢瓶子和捡瓶子的过程，由于本公开的聊天语料收集仅涉及用户捡瓶子的过程，因此，在此对用户捡瓶子的过程进行说明。

请参照图12所示的s920至s930的执行过程。在用户调用漂流瓶插件跳转进入匿名会话页面，即漂流瓶页面时，用户可在此漂流瓶页面发起丢瓶子和捡瓶子的过程。

在跳转进入漂流瓶页面的过程中，将进行用户属性的检查以获知用户所在城市、性别的属性信息、用户在限定的时间范围内捡瓶子的次数，以进行配额检查，得到用户当前所对应的捡瓶子的配额，即执行s920和s930的过程。

在还有捡瓶子的配额时，用户可在漂流瓶页面发起捡瓶子的过程，即向匿名会话系统发起会话请求，此时，由于此用户被匿名会话系统选取为聊天语料收集的目标用户，则更新其在匿名会话系统的好友关系，并获得智能服务系统动态生成的会话发起内容。而相对应的，也将更新配额等属性，即执行s960的过程。

图13是根据一示例性实施例示出的匿名会话系统的工作过程。如图13所示，在用户发起捡瓶子的过程时，匿名会话系统将获取用户属性并检查此用户的配额，即执行s1010和s1020。

在获得用户属性，并确认用户有捡瓶子的配额时，将判断当前是否需要进行聊天语料收集，即执行s1030。

在判断到是需要进行聊天语料收集时，将进一步判断是否让用户此次捡到智能服务系统的瓶子，即执行s1040。

如果判断用户此次不捡到智能服务系统的瓶子，则执行正常的捡瓶子流程，即从漂流瓶索引中获取其他用户的瓶子，并通过更新好友关系来获取其他用户的瓶子中的会话发起内容，相应更新配额等属性，即直接执行s1050至s1070的过程。

如果判断用户此次捡到智能服务系统的瓶子，则从智能服务系统获取会话发起内容，即执行s1080。

此时，也将通过好友关系的更新来将智能服务系统生成的会话发起内容发送给用户，进而通过用户与智能服务系统的不断回复即可实现聊天语料的收集。

图14是根据一示例性实施例示出的一种聊天语料收集方法的流程图。该聊天语料收集方法可以用于图1所示实施环境的会话系统130。如图14所示，该聊天语料收集方法，可以包括以下步骤。

在步骤1110中，获取智能服务系统根据目标语料信息生成的广播消息。

其中，智能服务系统将根据当前所需要进行的聊天语料收集生成目标语料信息，进而生成与此目标语料信息相符的广播消息。

广播消息用于智能服务系统在其所接入的会话系统中向全部或者大量用户广播，以发起广泛的聊天语料收集。

在步骤1130中，通过智能服务系统接入的会话系统向用户广播智能服务系统生成的广播消息。

在步骤1150中，通过广播消息进行智能服务系统与用户之间的会话，并保存会话中智能服务系统和用户各自的回复信息形成聊天语料。

其中，通过广播消息发起智能服务系统和用户之间的会话，并随着用户对此广播消息的响应进行用户与智能服务系统之间的会话。

随着会话的进行，一方面，对于智能服务系统，首先接收到用户响应广播消息而返回的用户回复信息；

对此，智能服务系统将获取此用户的用户画像信息，根据用户画像信息生成用户回复信息对应的个性化回复信息，以便于继续进行智能服务系统与用户之间的会话。

在后续所进行的会话中，智能服务系统将不断针对接收到的用户回复信息生成个性化回复信息。

另一方面，对于会话系统，将作为智能服务系统和用户之间的传递通道，以为接入的智能服务系统实现聊天语料收集。

图15是根据一示例性实施例示出的对步骤1150的细节进行的描述。该步骤1150如图15所示，可以包括以下步骤。

在步骤1151中，在通过广播消息发起的智能服务系统与用户之间的会话中，接收用户返回的用户回复信息，所述用户回复信息对应于所述广播消息或智能服务系统的个性化回复信息。

其中，个性化回复信息是指会话中智能服务系统针对用户返回的用户回复信息而根据用户画像信息生成的，以用于回复用户。

随着会话系统将智能服务系统的广播消息和个性化回复的依次发出，也将依次接收到用户返回的用户回复信息。

在步骤1153中，获取智能服务系统根据用户画像生成用户回复信息对应的个性化回复信息，并向用户返回。

在步骤1155中，广播消息、用户回复信息和个性化回复信息被依次保存，形成智能服务系统和用户之间会话的聊天语料，存储聊天语料。

通过如上所述的过程，便得以在广泛的用户中实现有针对性的聊天语料收集，从而最大限度地提高了聊天语料收集的效率。

下述为本公开装置实施

例，可以用于执行本公开上述智能服务系统110执行的聊天语料收集方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开聊天语料收集方法实施例。

图16是根据一示例性实施例示出的一种聊天语料收集装置的框图。该聊天语料收集装置可以用于图1所示实施环境的智能服务系统110中，执行图3所示的聊天语料收集方法的全部步骤。如图16所示，该聊天语料收集装置包括但不限于：目标用户标识获取模块1210、内容生成模块1230、会话发起内容推送模块1250和语料处理模块1270。

目标用户标识获取模块1210，用于获取目标用户对应的用户标识。

内容生成模块1230，用于根据用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容。

会话发起内容推送模块1250，用于向智能服务系统自身接入的会话系统推送会话发起内容。

语料处理模块1270，用于通过会话系统进行智能服务系统自身与目标用户之间与会话发起内容相关的会话，保存会话中智能服务系统和目标用户各自的回复信息形成聊天语料。

可选的，目标标识获取模块1210进一步用于接收会话系统通过进行目标用户选取而向智能服务系统返回的用户标识，用户标识对应于目标用户。

图17是根据一示例性实施例示出的对内容生成模块1130的细节进行的描述。如图17所示，内容生成模块1230包括但不限于：画像提取单元1231和内容生成执行单元1233。

画像提取单元1231，用于根据用户标识提取用户画像信息。

内容生成执行单元1233，用于生成与目标语料信息相关，且与用户画像相匹配的会话发起内容。

图18是根据一示例性实施例示出的语料处理模块1270的细节进行的描述。如图18所示，语料处理模块1270包括但不限于：用户回复信息接收单元1271、个性化回复生成单元1273和语料保存单元1275。

用户回复信息接收单元1271，用于在通过会话发起内容发起的智能服务系统自身与目标用户之间的会话中，通过会话系统接收目标用户根据会话发起内容或智能服务系统生成的个性化回复信息返回的用户信息。

个性化回复生成单元1273，用于生成用户回复信息对应的个性化回复信息，并通过会话系统向目标用户返回。

语料保存单元1275，用于用户回复信息和个性化回复信息被依次保存，形成智能服务系统和目标用户之间的聊天语料，存储聊天语料。

图19是根据一示例性实施例示出的一种聊天语料收集装置的框图。该聊天语料收集装置包括但不限于：目标用户选取模块1310、内容获取模块1330、内容推送模块1350和会话发起模块1370。

目标用户选取模块1310，用于对发起会话请求的用户进行目标用户选取，得到目标用户对应的用户标识。

内容获取模块1330，用于获取智能服务系统为目标用户生成的会话发起内容。

内容推送模块1350，用于通过智能服务系统与目标用户之间建立的好友关系进行会话发起内容的推送。

会话发起模块1370，用于通过会话发起内容的推送发起会话系统中智能服务系统与目标用户之间的会话。

可选的，如图20所示，目标用户选取模块1310包括会话判断单元1311和标识获取单元1313。

会话判断单元1311，用于在开启进行聊天语料收集时，对发起会话请求的用户判断该用户此次是否与智能服务系统进行会话，若为是，则通知标识获取单元1313，若为否，则进行会话系统中与其他用户的会话流程。

标识获取单元1313，用于将用户作为目标用户，获取目标用户对应的用户标识。

根据另一示例性实施例示出的一种聊天语料收集装置中，该聊天语料收集装置还包括关系更新模块。

关系更新模块，用于分别更新智能服务系统对应的好友关系和目标用户对应的好友关系，通过好友关系的更新建立智能服务系统和目标用户之间的好友关系。

图21是根据一示例性实施例示出的一种聊天语料收集装置，其应用于用户自身与智能服务系统的会话中，如图21所示，该聊天语料收集装置包括但不限于：请求发起模块1410、会话发起内容接收模块1430和聊天回复模块1450。

请求发起模块1410，用于通过调用的匿名会话插件向会话系统发起会话请求。

会话发起内容接收模块1430，用于接收会话系统通过建立用户自身与智能服务系统之间的好友关系而推送的会话发起内容。

聊天回复模块1450，用于通过会话发起内容发起会话系统中用户自身与智能服务系统之间的会话，在会话中，根据智能服务系统的会话发起内容或个性化回复信息通过会话系统向智能服务系统返回用户回复信息。

可选的，该聊天语料收集装置还包括展示模块。展示模块用于通过调用的匿名会话插件进行会话发起内容或个性化回复信息的展示。

图22是根据一示例性实施例示出的对聊天回复模块的细节进行的描述。该聊天回复模块1450包括但不限于：用户回复获取单元1451和信息返回单元1453。

用户回复获取单元1451，用于在通过会话发起内容发起会话系统中用户自身与智能服务系统之间的会话中，通过调用的匿名会话插件获取与智能服务系统的会话发起内容或个性化回复内容对应的用户回复信息。

信息返回单元1453，用于通过会话系统向智能服务系统返回用户回复信息。

图23是根据一示例性实施例示出的一种聊天语料收集装置的框图。如图23所示，该聊天语料收集装置包括但不限于：广播获取模块1510、广播模块1530和会话处理模块1550。

广播获取模块1510，用于获取智能服务系统根据目标语料信息生成的广播消息。

广播模块1530，用于通过智能服务系统接入的会话系统向用户广播智能服务系统生成的广播消息。

会话处理模块1550，用于通过广播消息进行智能服务系统与用户之间的会话，会话中智能服务系统和用户各自的回复信息被保存形成聊天语料。

图24是根据一示例性实施例示出的对会话处理模块的细节进行描述。如图24所示，该会话处理模块1550包括但不限于：用户回复接收单元1551、个性化回复获取单元1553和聊天语料存储单元1555。

用户回复接收单元1551，用于在通过广播消息发起的智能服务系统与用户之间的会话中，接收用户返回的用户回复信息，用户回复信息对应于广播消息或智能服务系统的个性化回复信息。

个性化回复获取单元1553，用于获取智能服务系统根据用户画像生成用户回复信息对应的个性化回复信息，并向用户返回。

聊天语料存储单元1555，用于广播消息、用户回复信息和个性化回复信息被依次保存，形成智能服务系统和用户之间会话的聊天语料，存储聊天语料。

可选的，本公开还提供一种聊天语料收集装置，该聊天语料收集装置可以用于图1所示实施环境的智能服务系统110中，执行图3、图4、图5、图7、图8、图9、图10、图14和图15的聊天语料收集方法的全部或者部分步骤。所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行：

智能服务系统获取目标用户对应的用户标识；

根据用户标识对应的用户画像信息和目标语料信息动态生成会话发起内容；

向智能服务系统自身接入的会话系统推送会话发起内容，通过会话发起内容发起智能服务系统与目标用户之间的会话；

智能服务系统通过会话系统进行自身与目标用户之间的会话，保存会话中智能服务系统和目标用户各自的回复信息形成聊天语料。

该实施例中的装置的处理器执行操作的具体方式已经在有关该xx方法的实施例中执行了详细描述，此处将不做详细阐述说明。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：路彦雄;刘秋阁
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：超仿棉聚酯连续生产系统的制作方法
上一篇：一种CAN总线的通讯方法和设备与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。