本公开涉及自然语言处理领域,尤其涉及一种信息处理方法、装置及计算机可读存储介质。
背景技术:
1、当下文本形式越来越多样化,不仅仅只包含单纯的文字。近些年来emoji表情愈来愈流行,在很多文本中可以见到,尤其是在社交媒体、电商、论坛等平台上。然而,在很多文本分析(例如,分词关键词抽取、文本分类、情感分析等)中,通常忽略文本中的emoji表情。但是在这些文本分析中,emoji表情往往扮演着重要的角色,甚至主导着文本分析的结果。例如,“使用起来”,去掉之前和之后句子所表达的含义完全不一样,但是经过emoji表情转文本表情后,句子变为“使用起来牛啤”,表达的情感和原句子相差无几。此外,emoji表情在文本生成、文本输入相关任务中也有很广的应用。例如:在电商评论或者聊天输入时,有时需要借助emoji表情来表达更加丰富的情感,通过输入指定词,获得对应的emoji表情。比如,今天天气不错笑脸”——今天天气不错”。可见,emoji表情和文本表情相互转换具有重要的研究意义。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种信息处理方法、装置及计算机可读存储介质。
2、根据本公开实施例的第一方面,提供一种信息处理方法,包括:
3、获取待转换表情信息,其中,所述待转换表情信息为文本表情信息或emoji表情信息;
4、确定所述待转换表情信息对应的同义词信息;
5、根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,其中,当所述待转换表情信息为文本表情信息时,所述候选表情集合包括多个emoji表情信息,当所述待转换表情信息为emoji表情信息时,所述候选表情集合包括多个文本表情信息。
6、可选地,所述确定所述待转换表情信息对应的同义词信息,包括:
7、确定所述待转换表情信息对应的参考语种的目标文本表情信息;
8、获取所述目标文本表情信息的同义词信息;
9、将所述目标文本表情信息的同义词信息确定为所述待转换表情信息对应的同义词信息。
10、可选地,所述获取所述目标文本表情信息的同义词信息,包括:
11、将所述目标文本表情信息输入到预先训练好的同义词模型中,得到所述目标文本表情信息的同义词信息。
12、可选地,在所述待转换表情信息为所述emoji表情信息的情况下,所述根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,包括:
13、确定目标语种;
14、若所述参考语种不是所述目标语种,则将所述目标文本表情信息和所述待转换表情信息对应的同义词信息翻译为所述目标语种;
15、将翻译后所得的目标文本表情信息和翻译后所得的待转换表情信息对应的同义词信息确定为所述待转换表情信息对应的候选表情集合。
16、可选地,在所述待转换表情信息为所述文本表情信息的情况下,所述确定所述待转换表情信息对应的同义词信息,包括:
17、获取所述待转换表情信息的同义词信息;
18、若所述待转换表情信息的语种不是参考语种,则将所述待转换表情信息的同义词信息翻译为所述参考语种;将翻译后所得的待转换表情信息的同义词信息确定为所述待转换表情信息对应的同义词信息;
19、若所述待转换表情信息的语种为所述参考语种,则将所述待转换表情信息的同义词信息确定为所述待转换表情信息对应的同义词信息。
20、可选地,在所述待转换表情信息为所述文本表情信息的情况下,所述根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,包括:
21、确定所述待转换表情信息对应的参考语种的目标文本表情信息;
22、根据预先建立的emoji表情信息与参考语种的文本表情信息的对应关系,确定与所述目标文本表情信息对应的第一目标emoji表情信息以及与所述待转换表情信息对应的每一同义词信息对应的第二目标emoji表情信息;
23、将所述第一目标emoji表情信息和所述待转换表情信息对应的每一同义词信息对应的第二目标emoji表情信息确定为所述待转换表情信息对应的候选表情集合。
24、可选地,在所述待转换表情信息为所述emoji表情信息的情况下,所述确定所述待转换表情信息对应的同义词信息,包括:
25、确定所述待转换表情信息对应的参考语种的目标文本表情信息;
26、确定目标语种;
27、若所述参考语种不是所述目标语种,则将所述目标文本表情信息翻译为所述目标语种;
28、获取翻译后所得的目标文本表情信息的同义词信息;
29、将翻译后所得的目标文本表情信息的同义词信息确定为所述待转换表情信息对应的同义词信息。
30、可选地,所述根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,包括:
31、将所述翻译后所得的目标文本表情信息和所述待转换表情信息对应的同义词信息确定为所述待转换表情信息对应的候选表情集合。
32、可选地,所述确定所述待转换表情信息对应的同义词信息,还包括:
33、若所述参考语种为所述目标语种,则获取所述目标文本表情信息的同义词信息;
34、将所述目标文本表情信息的同义词信息确定为所述待转换表情信息对应的同义词信息。
35、可选地,所述根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,包括:
36、将所述目标文本表情信息和所述待转换表情信息对应的同义词信息确定为所述待转换表情信息对应的候选表情集合。
37、根据本公开实施例的第二方面,提供一种信息处理装置,包括:
38、获取模块,被配置为获取待转换表情信息,其中,所述待转换表情信息为文本表情信息或emoji表情信息;
39、第一确定模块,被配置为确定所述获取模块获取到的所述待转换表情信息对应的同义词信息;
40、第二确定模块,被配置为根据所得获取模块获取到的所述待转换表情信息和所述第一确定模块确定出的所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,其中,当所述待转换表情信息为文本表情信息时,所述候选表情集合包括多个emoji表情信息,当所述待转换表情信息为emoji表情信息时,所述候选表情集合包括多个文本表情信息。
41、根据本公开实施例的第三方面,提供一种信息处理装置,包括:
42、处理器;
43、用于存储处理器可执行指令的存储器;
44、其中,所述处理器被配置为:
45、获取待转换表情信息,其中,所述待转换表情信息为文本表情信息或emoji表情信息;
46、确定所述待转换表情信息对应的同义词信息;
47、根据所述待转换表情信息和所述待转换表情信息对应的同义词信息,确定所述待转换表情信息对应的候选表情集合,其中,当所述待转换表情信息为文本表情信息时,所述候选表情集合包括多个emoji表情信息,当所述待转换表情信息为emoji表情信息时,所述候选表情集合包括多个文本表情信息。
48、根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的信息处理方法的步骤。
49、本公开的实施例提供的技术方案可以包括以下有益效果:获取待转换表情信息,其中,待转换表情信息为文本表情信息或emoji表情信息;确定待转换表情信息对应的同义词信息;根据待转换表情信息和待转换表情信息对应的同义词信息,确定待转换表情信息对应的候选表情集合,其中,当待转换表情信息为文本表情信息时,候选表情集合包括多个emoji表情信息,当待转换表情信息为emoji表情信息时,候选表情集合包括多个文本表情信息。由此,可以实现文本表情信息向emoji表情信息的转换,从而节约肉眼查找emoji表情信息的时间,提高文本输入效率,还可以实现emoji表情信息向文本表情信息的转换,提升文本分析的效率和准确度。并且,能够基于同义词信息,为用户提供多个候选的转换结果,从而更好地与当前文本进行适配。
50、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。