构建情感词典的方法及装置与流程

文档序号:12719627阅读:来源:国知局

技术特征:

1.一种构建情感词典的方法,其特征在于,所述方法包括:

获取多个待识别的建模语料;

从每个待识别的建模语料中,获取至少一个情感特征词;

对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,所述至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;

根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件;

如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中。

2.根据权利要求1所述的方法,其特征在于,所述从每个待识别的建模语料中,获取至少一个情感特征词,包括:

采用指定分词算法将每个待识别的建模语料切分为多个语素片;

对所述多个语素片进行过滤,得到至少一个情感特征词。

3.根据权利要求1所述的方法,其特征在于,所述对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,包括:

将所述情感特征词及分类情感标签列表发送至所述发表者所在的移动终端,所述分类情感标签列表中包括多个分类情感标签;

接收所述发表者所在移动终端发送的第一标注结果,所述第一标注结果为所述发表者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;

将所述情感特征词及所述分类情感标签列表发送至多个接收者所在的移动终端;

接收每个接收者所在的移动终端发送的第二标注结果,所述第二标注结果为所述接收者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;

将所述第一标注结果及多个第二标注结果作为所述至少两个标注结果。

4.根据权利要求1所述的方法,其特征在于,所述根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件,包括:

对所述情感特征词的至少两个标注结果进行统计,得到对所述情感特征词的总标记数;

判断所述总标记数是否大于第一阈值;

如果所述总标记数大于所述第一阈值,则根据每个标注结果对应的分类情感标签,将所述至少两个标注结果划分为多种分类结果;

获取每种分类结果在所述总标记数中所占的比值;

从每种分类结果在所述总标记数中所占的比值中,获取最大比值;

判断所述最大比值是否大于第二阈值;

如果所述最大比值大于所述第二阈值,则确定所述情感特征词满足预设条件。

5.根据权利要求4所述的方法,其特征在于,所述如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中,包括:

将所述情感特征词及所述最大比值对应的分类情感标签加入到情感词典中。

6.根据权利要求3所述的方法,其特征在于,所述分类情感标签列表中包括的分类情感标签为乐标签、好标签、怒标签、哀标签、惧标签、恶标签、惊标签,且每个分类情感标签中包括多个子标签;

其中,所述好标签包括尊敬子标签、赞扬子标签、相信子标签、喜好子标签、祝愿子标签;所述怒标签包括愤怒子标签;所述哀标签包括悲伤子标签、失望子标签、疚子标签、思子标签;所述惧标签包括慌子标签、恐惧子标签、羞子标签;所述恶标签包括烦闷子标签、憎恶子标签、贬责子标签、妒忌子标签、怀疑子标签;所述惊标签包括惊奇子标签。

7.一种构建情感词典的装置,其特征在于,所述装置包括:

第一获取模块,用于获取多个待识别的建模语料;

第二获取模块,用于从每个待识别的建模语料中,获取至少一个情感特征词;

第三获取模块,用于对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,所述至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;

判断模块,用于根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件;

加入模块,用于当所述情感特征词满足所述预设条件时,将所述情感特征词加入到情感词典中。

8.根据权利要求7所述的装置,其特征在于,所述第二获取模块,用于采用指定分词算法将每个待识别的建模语料切分为多个语素片;对所述多个语素片进行过滤,得到至少一个情感特征词。

9.根据权利要求7所述的装置,其特征在于,所述第三获取模块,用于将所述情感特征词及分类情感标签列表发送至所述发表者所在的移动终端,所述分类情感标签列表中包括多个分类情感标签;接收所述发表者所在移动终端发送的第一标注结果,所述第一标注结果为所述发表者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;将所述情感特征词及所述分类情感标签列表发送至多个接收者所在的移动终端;接收每个接收者所在的移动终端发送的第二标注结果,所述第二标注结果为所述接收者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;将所述第一标注结果及多个第二标注结果作为所述至少两个标注结果;

所述分类情感标签列表中包括的分类情感标签为乐标签、好标签、怒标签、哀标签、惧标签、恶标签、惊标签,且每个分类情感标签中包括多个子标签;

其中,所述好标签包括尊敬子标签、赞扬子标签、相信子标签、喜好子标签、祝愿子标签;所述怒标签包括愤怒子标签;所述哀标签包括悲伤子标签、失望子标签、疚子标签、思子标签;所述惧标签包括慌子标签、恐惧子标签、羞子标签;所述恶标签包括烦闷子标签、憎恶子标签、贬责子标签、妒忌子标签、怀疑子标签;所述惊标签包括惊奇子标签。

10.根据权利要求7所述的装置,其特征在于,所述判断模块,用于对所述情感特征词的至少两个标注结果进行统计,得到对所述情感特征词的总标记数;判断所述总标记数是否大于第一阈值;当所述总标记数大于所述第一阈值时,根据每个标注结果对应的分类情感标签,将所述至少两个标注结果划分为多种分类结果;

获取每种分类结果在所述总标记数中所占的比值;从每种分类结果在所述总标记数中所占的比值中,获取最大比值;判断所述最大比值是否大于第二阈值;当所述最大比值大于所述第二阈值时,确定所述情感特征词满足预设条件;

所述加入模块,用于将所述情感特征词及所述最大比值对应的分类情感标签加入到情感词典中。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1