一种基于语义理解的表情输入方法和装置的制造方法

文档序号：9217254阅读：545来源：国知局

一种基于语义理解的表情输入方法和装置的制造方法
【专利说明】
[0001] 本发明实施例要求在2014年6月6日提交中国专利局、申请号为 201410251399.0、发明名称为"一种基于语义理解的表情输入方法和装置"的中国专利申请的优先权，其全部内容通过引用结合在本发明实施例中。
技术领域
[0002] 本发明涉及输入法技术领域，具体涉及一种基于语义理解的表情输入方法和装置。
【背景技术】
[0003] 输入法是为将各种符号输入计算机或其他设备（如手机）而采用的编码方法。常见的输入法包括搜狗输入法，微软输入法等等。
[0004] 传统的表情输入大致有几种情况：其一是平台本身具有表情输入模块，比如qq等聊天工具嵌入的表情输入模块，其自带默认的输入表情，也可以安装第三方表情包，用户也可以自定义图片资源作为表情，当用户输入表情时，点击表情的输入按钮，选择表情进行输入；但是该种情况与输入法完全脱离，用户在输入过程中需要单独点击表情输入按钮，逐页翻找并点击自己需要和喜欢的表情来完成输入过程；
[0005] 其二，是输入法自带简单的符号表情，当用户输入到相应字符时，比如（"哈哈"对应的符号表情"〇( n _ n )〇~")，符号表情以候选项的形式供用户选择。但这种情况的候选表情简单，无法给用户提供丰富多彩的表情输入。
[0006] 其三，是输入法提供加载的第三方表情包，提供用户表情输入的入口，当用户有需求输入表情时，需要点击进入该应用程序表情输入的入口，然后在大量的表情资源中，逐页翻找并点击自己需要或喜欢的表情完成输入过程。
[0007] 以按钮接口的形式嵌入在应用程序中，提供给用户进行表情输入，这种方法存在多种问题：
[0008] 1.用户的聊天行为属于即时通信，时效性极强。因此，表情输入的时效性非常重要。如果用户喜欢并安装的各种主题表情库有多个（包括阿狸、嘻哈猴、轻松熊、冷兔等等），每个表情库又包含上百种表情符号或图片（如微笑、哈哈大笑、猥琐的笑、抹眼泪、嚎啕大哭等等）。那么，有限的时间内，在众多表情库中逐一翻找到合适的表情所花费的时间成本，会成为用户有效使用各种表情增强沟通效果的瓶颈。
[0009] 2.因为考虑到用户使用表情的操作成本，表情包制作方也会酌情精简表情内容，这也从某种程度上制约了聊天表情的发展和广泛使用。
[0010] 3.大多数聊天工具只会提供默认表情。默认表情相对比较单调，更多丰富的多元化的主题聊天表情资源可以有效提高与朋友聊天的好感度，但是为了使用这些表情，用户需要经过很多网上操作步骤，从各种渠道获取表情包信息并将表情包下载到本地，有时还需要进行手工加载才可以正常使用表情包。对于操作生疏或者没有足够耐心的用户，在网络资源中成功获取并安装合适的表情包所花费的时间成本，可能会导致他们选择放弃。
[0011] 4.对于下载好的表情包，如果用户切换聊天平台等输入场景，表情包需要重新下载或更新，用户的常用表情收藏信息也同样面临移植的问题。
[0012] 输入的候选表情内容仅限于第三方制作好的表情包。若非特意整理，很多明星人物、政治人物的夸张表情照片、GIF等多媒体资源并不能够及时的作为候选表情，输入的内容过于单一，而且无法快速精准契合用户当前的输入，降低了用户的输入效率。

【发明内容】

[0013] 鉴于上述问题，本发明提供一种克服上述问题或者至少部分地解决上述问题的基于语义理解的表情输入方法和装置。
[0014] 依据本发明的一个方面，提供了一种基于语义理解的表情输入方法，包括：
[0015] 获取输入序列对应的文本内容；
[0016] 对所述文本内容进行分词，并基于分词的结果，提取文本特征；
[0017] 以所述文本特征构建输入向量，利用情感分类模型进行分类，以确定所述文本内容所属的情感标签；
[0018] 获取表情资源数据中与所述情感标签对应的第一表情；
[0019] 将获取的所述第一表情排序后，作为候选项在客户端展示。
[0020] 根据本发明的另一方面，提供了一种基于语义理解的表情输入装置，包括：
[0021] 内容获取模块，配置为获取输入序列对应的文本内容；
[0022] 分词特征提取模块，配置为对所述文本内容进行分词，并基于分词的结果，提取文本特征；
[0023] 情感标签确定模块，配置为以所述文本特征构建输入向量，利用情感分类模型进行分类，以确定所述文本内容所属的情感标签；
[0024] 表情获取模块，配置为获取表情资源数据中与所述情感标签对应的第一表情；及
[0025] 展示模块，配置为将获取的所述第一表情排序后，作为候选项在客户端展示。
[0026] 相对现有技术，本发明实施例具有如下优点：
[0027] 本发明实施例将各种来源的表情资源数据，利用语聊资源数据，比如聊天日志 (如匿名获取qq、微信等聊天工具有表情输入的聊天日志）、社区评论（如京东、大众点评等有表情输入的评论内容）、社交内容（如qq空间、新浪微博、人人网等有表情输入的状态或评论内容），对所有获取的表情资源数据进行分析，以构建情感标签与各主题中的表情的对应关系。然后即可针对由用户输入序列得到的文本内容，进行语义理解，得到对应的文本特征，然后基于预先构建的情感分类模型对所述文本特征进行分类，以确定用户输入对应的情感标签，进而根据情感标签和第一表情的对应关系，从表情资源数据中提取对应的第一表情作为候选项以供用户选择。
[0028] 上述过程中，
[0029] 其一，将表情作为输入法的词库，可直接对由用户的输入序列得到的文本内容进行语义理解，根据语义理解得到的情感标签与表情资源数据中的第一表情的对应关系，获取表情资源数据中的第一表情作为候选项在输入法中进行展示，直接提供给用户选择；
[0030] 其二，上述过程能够精确匹配用户的表情输入需求，因此能够提高表情的使用效率，从而能够降低用户在表情输入过程中翻找待输入的表情所花费的时间成本；
[0031] 其三，该种方式不用考虑表情包的制作成本和内容，可以任意发挥制作方的创造力，降低对聊天表情的发展和广泛使用的制约；
[0032] 其四，由于本发明实施例将各主题的表情进行集中分类处理，用户不用到处下载各主题的表情包，因此能够降低用户寻找表情包的时间成本；
[0033] 其五，由于本发明实施例的第一表情是输入法的候选项，用户在切换聊天平台等输入场景时，不需要重新下载或更新表情包，也避免用户的常用表情收藏信息的移植问题；
[0034] 其六，本发明实施例表情资源数据中的第一表情范围广，覆盖面积大，可以给用户提供更多、更丰富的输入语料。
【附图说明】
[0035] 通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：
[0036] 图1示出了根据本发明一个实施例的一种基于语义理解的表情输入方法的流程示意图；
[0037] 图2示出了根据本发明一个实施例的构建情感标签与各主题中的表情之间对应关系的流程示意图；
[0038] 图3示出了根据本发明一个实施例的语聊资源的示例；
[0039]图4示出了根据本发明一个实施例的构建情感分类模型的流程示意图；
[0040] 图5示出了根据本发明一个实施例的构建情感分类模型的流程示意图；
[0041] 图6示出了根据本发明一个实施例的表情展示示例；
[0042] 图7示出了根据本发明一个实施例的一种基于语义理解的表情输入方法的流程示意图；
[0043] 图8示出了根据本发明一个实施例的一种基于语义理解的表情输入方法的流程示意图；
[0044] 图9示出了根据本发明一个实施例的一种基于语义理解的表情输入装置的结构示意图；
[0045] 图10示出了根据本发明一个实施例的一种基于语义理解的表情输入装置的结构示意图；及
[0046] 图11示出了根据本发明一个实施例的一种基于语义理解的表情输入系统的结构示意图。
【具体实施方式】
[0047] 为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0048] 本发明将收集的各种来源的表情资源数据，比如互联网中各主题的表情包资源 (如qq的阿狸、嘻哈猴、郭德纲真人夸张表情照片集等的表情包）、第三方合作的表情包资源（输入法直接与卡通表情生产方进行合作并搭建获取流程）、用户产生的自定义的表情内容（输入法直接开放接口是用户可以添加自定义表情并共享）等表情资源数据，利用语聊资源数据，比如聊天日志（如匿名获取qq、微信等聊天工具有表情输入的聊天日志）、社区评论（如京东、大众点评等有表情输入的评论内容）、社交内容（如qq空间、新浪微博、人人网等有表情输入的状态或评论内容），对所有获取的表情资源数据进行分析，确定表情类别的情感标签与表情资源数据中的第一表情之间的对应关系，并利用情感标签与表情资源数据中的第一表情之间的对应关系构建情感分类模型，然后即可在用户使用输入法的过程中，使用情感分类模型对用户输入的文本内容进行语义识别，然后基于识别结果直接提供表情候选项给客户端，给用户提供更方便、更快捷、更丰富的表情输入。
[0049] 实施例一
[0050] 首先，本发明实施例中，构建用于语义分析的情感分类模型，以及情感标签与表情的对应关系；其中，上述情感标签可用于表示表情所能表达的语义情感，其包括但不限于快乐情感标签、称赞情感标签等；上述情感分类模型具有多种情感标签的分类能力，假设情感标签的种类为N，则情感分类模型也可以输出N种分类结果。
[0051] 即步骤S100,根据语聊资源数据和各主题的表情资源数据构建表情资源数据中包括的第一表情与情感标签之间的对应关系。
[0052] 在本发明实施例中，情感标签与表情资源数据中的第一表情之间的对应关系可以通过收集语聊资源数据和表情资源数据，并利用语聊资源数据对表情资源数据进行分析得到。在本

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾思宇;刘华生;张阔;
技术所有人：北京搜狗科技发展有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。