本发明涉及自然语言处理,具体包括一种面向社交平台的少样本用户意图识别方法。
背景技术:
1、近年来,随着互联网的普及,各大社交平台吸引了广大网民的眼球。在使用社交平台的过程中,网民可以浏览平台内推送的新闻以及其他用户发表的内容,并根据新闻或推文的内容发表自己的观点。这些观点也会被其他用户所浏览,并引发新一轮的讨论。早在2020年9月,微博日活用户就已达到了2.2亿,其中绝大多数为90后与00后。当数以亿计的用户在社交平台中对一些突发事件进行评论时,非常容易产生重大网络舆情。
2、例如,2022年12月4日人民日报发布了一条微博,内容为公布了当年的各省级教育招生考试机构的考研咨询方式,并收到了超过三千条用户评论。一部分用户表示希望能延期考研,另一部分用户希望考试如期进行。还有个别用户表达了对考生的祝福。之后持有不同观点的用户就各自的意图展开了激烈的讨论。而用户评论中蕴含的意图显著影响了该舆情的发展。当一些突发、敏感事件发生时,负面意图极有可能导致负面舆情的爆发。因此如何对社交平台中用户意图进行有效识别成为目前急需解决的问题。
3、在现有的意图识别模型的训练方法中,首先在训练初期弱化对特定意图语料的识别,然后利用训练初期的意图识别模型判别难以区分的意图,之后对这些意图语料重新分配标签,并再次训练意图识别模型以获得更好的意图识别性能。但是,在获取用于模型训练的数据时,方法仅利用固定类别的数据进行训练,无法做到对新的意图进行识别。然而在社交平台中,用户的意图会随着时间、环境以及评论事件的变化而发生改变。新的意图类别不断出现,就要求意图识别模型需要具备识别新类别的能力。并且现有技术也没有提出利用少量数据即可快速实现对新意图的识别的方法。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种面向社交平台的少样本用户意图识别方法解决了现有技术无法做到对新的意图进行识别、无法用少量数据快速识别新意图的问题。
2、为了达到上述发明目的,本发明采用的技术方案为:一种面向社交平台的少样本用户意图识别方法,包括以下步骤:
3、s1、获取社交平台的数据,并对数据进行预处理;
4、s2、从预处理后的数据中采样numbase个task数据作为训练数据,采样numnovel个task数据作为待识别数据;
5、s3、构建语言模型bert,使用训练数据对语言模型bert进行训练,得到训练好的模型;
6、s4、根据训练好的模型对待识别数据进行用户意图识别。
7、进一步地,步骤s1的具体实现方式如下:
8、s1-1、获取社交平台的数据;
9、s1-2、根据社交平台的数据收集常见意图语料集sentencebase和新意图语料集sentencenovel。
10、进一步地,步骤s2的具体实现方式如下:
11、s2-1、从常见意图预料中采样numbase个task数据作为训练数据tbase;其中,task包括数据{ts,tq},ts为n×k个有标注的数据,tq为n×q个无标注的数据,n表示n个类,k表示每个类有k个带标注数据,q表示每个类有q个无标注的数据;表示第numbase个task数据;
12、s2-2、从新意图预料中采样numnovel个task数据作为待识别数据tnovel;其中,表示第numnovel个task数据。
13、进一步地,步骤s3的具体实现方式如下:
14、s3-1、使用语言模型bert的意图特征提取模块根据训练数据提取意图特征;
15、s3-2、使用语言模型bert的类别中心生成模块对意图特征进行处理,得到训练数据的类别中心;
16、s3-3、使用语言模型bert的待识别语义挖掘模块对每个task数据的意图特征挖掘高级语义信息;
17、s3-4、根据类别中心和高级语义信息进行意图类别检测,得到当前高级语义信息的类别;
18、s3-5、计算高级语义信息的类别检测的损失进行反向传播,更新模型的参数;
19、s3-6、重复步骤s3-1至s3-5直到预定的次数,得到训练好的模型。
20、进一步地,步骤s3-1的具体实现方式如下:
21、对训练数据tbase进行意图特征提取;得到有标注数据ts的意图特征ls,ls=bert(ts);无标注数据tq的意图特征lq,lq=bert(tq)。
22、进一步地,步骤s3-2的具体实现方式如下:
23、s3-2-1、提取有标注数据ts的意图特征ls中同一类的意图特征l={l1,l,…,lm};其中,lm表示同一类的意图特征中第m个意图特征;
24、s3-2-2、根据公式:
25、
26、得到训练数据的类别中心proto;其中,p是卷积核的编号;(i,j,k)为卷积起始位置;(p11,p21,p31)为三维卷积核的尺寸;为三维卷积核的权重矩阵;为三维卷积核的偏置。
27、进一步地,步骤s3-3的具体实现方式如下:
28、根据公式:
29、
30、得到高级语义信息h;其中,(p’11,p’21)为二维卷积核的尺寸;为二维卷积核的权重矩阵;为二维卷积核的偏置;(i’,j’)为卷积起始位置。
31、进一步地,步骤s3-4的具体实现方式如下:
32、s3-4-1、根据公式:
33、dc=euc(ha,protob)
34、得到高级语义信息到类别中心的距离dc;其中,euc(·)表示欧式距离;ha为第a个高级语义信息;protob为第b个类别中心;c表示第c个距离;
35、s3-4-2、选择最短的高级语义信息到类别中心的距离对应的类别,作为当前高级语义信息的类别。
36、本发明的有益效果为:本发明使用少样本学习方法,并与意图识别方法相结合,利用少量的带标注的新意图句子即可帮助意图识别模型实现对新意图的快速识别,简化了计算量,提高了意图识别效率,易于实现和大规模部署;意图识别模型训练高效可靠,可以有效识别舆情发展过程中出现的全新的用户意图,为管理社交平台提供用户的舆论引导方向的依据,具有实用性。
1.一种面向社交平台的少样本用户意图识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s1的具体实现方式如下:
3.根据权利要求2所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s2的具体实现方式如下:
4.根据权利要求3所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s3的具体实现方式如下:
5.根据权利要求4所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s3-1的具体实现方式如下:
6.根据权利要求5所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s3-2的具体实现方式如下:
7.根据权利要求6所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s3-3的具体实现方式如下:
8.根据权利要求7所述的一种面向社交平台的少样本用户意图识别方法,其特征在于,步骤s3-4的具体实现方式如下: