消息分类方法、装置、电子设备及可读存储介质与流程

文档序号:31026476发布日期:2022-08-06 00:48阅读:86来源:国知局
消息分类方法、装置、电子设备及可读存储介质与流程

1.本技术属于通信技术领域,具体涉及一种消息分类方法、装置、电子设备及可读存储介质。


背景技术:

2.随着便携式电子设备的普及和短信业务的迅速发展,人们频繁地使用短信进行通信。
3.在相关技术中,电子设备在接收到联系人发送的短信后,或将短信归档在该联系人对应的文件目录下,当用户需要查找需求查看的某些短信时,需要在多个文件目录中保存的大量短信中逐个浏览短信,例如,用户需要查看重要的通知信息时,需要在大量的短信中去依次翻阅查找。如此,导致短信消息的查找过程步骤繁琐、且耗时长。


技术实现要素:

4.本技术实施例的目的是提供一种消息分类方法,能够解决消息的查找过程步骤繁琐、且耗时长的问题。
5.第一方面,本技术实施例提供了一种消息分类方法,该方法包括:获取第一消息的消息内容,该消息内容中包含n个分词,上述n个分词中包含至少一个关键词,对上述至少一个关键词进行词性融合,生成目标关键词,将上述目标关键词与上述n个分词进行融合,得到目标消息内容;基于上述目标消息内容,确定第一消息的消息类型。
6.第二方面,本技术实施例提供了一种消息分类装置,该装置包括:获取模块,生成模块和确定模块,其中:上述获取模块,用于获取第一消息的消息内容;上述消息内容中包含n个分词;上述n个分词中包含至少一个关键词,n为正整数;上述生成模块,用于对获取模块获取的至少一个关键词进行词性融合,生成目标关键词;上述生成模块,还用于将目标关键词与n个分词进行融合,得到目标消息内容;上述确定模块,用于基于生成模块得到的目标消息内容,确定第一消息的消息类型。
7.第三方面,本技术实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
8.第四方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
9.第五方面,本技术实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
10.第六方面,本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
11.在本技术实施例中,消息分类装置获取第一消息的消息内容,该消息内容中包含n
个分词,上述n个分词中包含至少一个关键词,对上述至少一个关键词进行词性融合,生成目标关键词,并将生成的目标关键词与上述n个分词进行融合,得到目标消息内容,然后基于上述目标消息内容,确定第一消息的消息类型。通过该方法,消息分类装置可以对第一消息中的关键词进行提取以及词性融合,从而得到融合第一消息中的关键词的信息的目标关键词,然后将该目标关键词与第一信息中的每个分词进行词性融合,从而得到融合第一信息中的关键词与非关键词的重点信息,并基于该重点信息确定第一消息的消息类型,最后将该第一消息存入与其消息类型匹配的目标文件。如此,使得第一信息中的每一个分词与第一信息中的关键词互通各自包含的信息,能够准确地获取第一信息中包含的重点信息,从而能够提升确定的第一消息的消息类型的准确性,进而能够对消息进行有效分类,提高用户查看消息的便捷性。
附图说明
12.图1为本技术实施例提供的消息分类方法的流程图;
13.图2(a)为本技术实施例提供的消息分类方法的界面示意图之一;
14.图2(b)为本技术实施例提供的消息分类方法的界面示意图之二;
15.图2(c)为本技术实施例提供的消息分类方法的界面示意图之三;
16.图2(d)为本技术实施例提供的消息分类方法的界面示意图之四;
17.图3为本技术实施例提供的消息分类装置的结构示意图;
18.图4为本技术实施例提供的电子设备的结构示意图;
19.图5为本技术实施例提供的电子设备的硬件结构示意图。
具体实施方式
20.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
21.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
22.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的消息分类方法进行详细地说明。
23.本技术实施例提供一种消息分类方法,图1示出了本技术实施例提供的消息分类方法的流程图。如图1所示,本技术实施例提供的消息分类方法可以包括下述的步骤201至步骤204:
24.步骤201:消息分类装置获取第一消息的消息内容。
25.其中,上述消息内容中包含n个分词;上述n个分词中包含至少一个关键词,n为正整数。
26.需要说明的是,上述关键词也可以称为重点词。
27.在本技术实施例中,上述第一消息可以是短信,也可以是聊天软件的信息,如社交应用中的聊天消息,也可以是购物网站的消息,如商品消息等;还可以是其他的信息,本技术实施例不作限定。
28.在本技术实施例中,上述第一消息为待分类消息。
29.在本技术实施例中,上述第一消息可以是新接收的消息,也可以是已经接收的消息中的任意一条待分类消息,本技术实施例不作限定。示例性的,本发明实施例提供的消息分类方法,可以是接收一条消息,分类一条消息;也可以是按照预设周期,周期性的对已接收的消息分类;也可以是设定当消息的数量达到预设条数时,再分类。
30.需要说明的是,本技术实施例中的第一消息也可以称为第一信息。
31.在本技术实施例中,消息分类装置可以对第一消息的消息内容进行分词处理,得到第一消息中包含的至少一个分词。示例性地,以第一消息为短信为例,可以使用jieba软件包对短信文本进行分词处理,并去除分词后的所有停用词(如语气词),得到该短信内容中包含具体含义的n个分词。
32.在本技术实施例中,上述至少一个关键词可以为目标语音消息中的特定词性特征(如,名词)的词语。示例性的,上述至少一个关键词可以包括:消息内容中的人名、地名、机构名、事件名等。例如,第一消息的消息内容包括“我们明天9点在b座504会议室开会”,则消息分类装置可以通过语义识别,得到该目标语音消息对应的至少一个关键词分别为:“明天9点”、“b座504会议室”和“开会”。
33.需要说明的是,通常情况下,信息中的一些特定词性特征(如,名词)的词语更易成为消息中的关键信息。因此,可以将目标语音消息对应语义信息中包含的关键词,视为目标语音信息中的关键信息。
34.在一种可能的实现方式中,消息分类装置可以对得到的n个分词进行语义识别,得到语义识别结果(即,上述语义信息),然后基于语义识别结果,从中确定出至少一个关键词。
35.在另一种可能的实现方式中,消息分类装置可以采用预设算法计算出第一消息的消息内容中的每个分词的相似度信息,然后基于相似度信息从多个分词中确定出至少一个关键词。
36.示例1,以第一消息中包括n+1个分词为例,采用预设算法确定第一消息中的至少一个关键词的过程可以包括以下步骤11至步骤15:
37.步骤11:分别计算该n+1个词的词向量,得到该第一消息的词向量分别为[w1,w2,

,w
n+1
],其中w1表示第一个分词的向量,以此类推。
[0038]
步骤12:把每一个分词分别与除该分词之外的其余所有分词作余弦相似度计算,得到相似度得分为[α
1,1

1,2
,


1,n
;α
2,1

2,2
,


2,n


;α
n+1,1

n+1,2
,


n+1,n
]。
[0039]
步骤13:把每一个分词分别和除该分词之外的其余所有分词的相似度得分作归一化处理,处理之后的相似度分数为[β
1,1

1,2
,


1,n
;β
2,1

2,2
,


2,n


;β
n+1,1

n+1,2
,


n+1,n
],其中β
1,1
β
1,1
等于依次类推。
[0040]
步骤14:对归一化之后的相似度得分计算方差,得到每一个分词与其余分词相似度的方差[var1,var2,

,var
n+1
]。
[0041]
步骤15:确定方差较大的m个分词作为重点词,上述m个重点词的词向量可以表示为:[v1,v2,

,vm],其中v1表示第一个重点词的词向量,以此类推。
[0042]
步骤202:消息分类装置对上述至少一个关键词进行词性融合,生成目标关键词。
[0043]
在本技术实施例中,消息分类装置可以采用预设算法,根据至少一个关键词的词性信息,将得到的至少一个关键词进行合并,生成目标关键词。
[0044]
在本技术实施例中,上述目标关键词包括:融合上述至少一个关键词的语义信息的信息。示例性地,假设第一消息的消息内容包括“部门同事明天下班后去团建”,该消息内容中的至少一个关键词分别为:“部门”“同事”和“团建”,则对至少一个关键词合并后得到的目标关键词为:“公司团建”。
[0045]
步骤203:消息分类装置将上述目标关键词与上述n个分词进行融合,得到目标消息内容。
[0046]
在本技术实施例中,消息分类装置可以采用预设算法,将上述目标关键词与上述n个分词进行融合。
[0047]
示例性地,对于第一消息中的所有分词,依次把每个分词的和目标关键词进行融合,得到目标消息内容。
[0048]
需要说明的是,将第一消息的消息内容中的所有分词依次与目标关键词进行融合,目的是使得第一消息中的每一个分词与重点词进行相互影响,互通各自包含的信息,也就是把消息内容中的所有分词和融合后的重点词作为一个整体,使得得到的目标消息内容既能反映第一消息中的重点信息,又不会丢失一些看似不是那么重要的词语的信息,从而得到能够准确反映第一消息的重点信息的消息内容。
[0049]
步骤204:消息分类装置基于上述目标消息内容,确定第一消息的消息类型。
[0050]
在本技术实施例中,消息分类装置可以通过预设算法,计算目标消息内容与预设消息类型的匹配度,然后将与目标消息内容匹配度最高的消息类型,确定为第一消息的消息类型;或者,消息分类装置可以通过预设深度模型,基于目标消息内容预测该第一消息的消息类型;或者,消息分类装置可以通过查询保存有消息内容与消息类型的对应关系的对照表,将该目标消息内容对应的消息类型确定为第一消息的消息类型。
[0051]
可选地,在本技术实施例中,上述预设消息类型可以包括以下至少一项:验证码,取件码,广告,通知,骚扰,工作事项等等,上述预设消息类型具体可以根据实际需求设置,本技术实施例对此不做任何限定。
[0052]
在本技术实施例提供的消息分类装置中,消息分类装置获取第一消息的消息内容,该消息内容中包含n个分词,上述n个分词中包含至少一个关键词,对上述至少一个关键词进行词性融合,生成目标关键词,并将生成的目标关键词与上述n个分词进行融合,得到目标消息内容,然后基于上述目标消息内容,确定第一消息的消息类型。通过该方法,消息分类装置可以对第一消息中的关键词进行提取以及词性融合,从而得到融合第一消息中的关键词的信息的目标关键词,然后将该目标关键词与第一信息中的每个分词进行词性融合,从而得到融合第一信息中的关键词与非关键词的重点信息,并基于该重点信息确定第一消息的消息类型,最后将该第一消息存入与其消息类型匹配的目标文件。如此,使得第一
信息中的每一个分词与第一信息中的关键词互通各自包含的信息,能够准确地获取第一信息中包含的重点信息,从而能够提升确定的第一消息的消息类型的准确性,进而能够对消息进行有效分类,提高用户查看消息的便捷性。
[0053]
可选地,在本技术实施例中,上述步骤202可以包括以下步骤202a:
[0054]
步骤202a:消息分类装置基于每个关键词的描述信息,对上述至少一个关键词进行词性融合,生成目标关键词。
[0055]
其中,上述描述信息包括以下至少之一:
[0056]
上述关键词的词性信息;
[0057]
上述关键词与上n个分词中其他分词间的关联信息。
[0058]
可选地,上述关联信息可以为分词间的相似度信息。
[0059]
在一种可能的实现方式中,消息分类装置将第一消息中的至少一个关键词通过相似度的方差以及词性进行融合。
[0060]
示例性地,消息分类装置可以根据每个分词分别和其余词语的相似度,得到每一个分词与其余分词的相似度的方差,并通过查询词性表,获取第一消息的消息内容中的所有分词的词性,在从中确定出至少一个关键词的方差以及词性,然后基于该方差以及词性信息对该至少一个关键词进行融合。
[0061]
需要说明的是,对于分词的相似度以及方差的计算可以参见上文,此处不再赘述。
[0062]
示例2,结合上述示例1,以第一消息中包括n+1个分词为例,上述融合过程可以包括以下步骤21至步骤25:
[0063]
步骤21:获取重点词的词性并为词性赋权重。
[0064]
示例地,不同的词性有不同的权重,例如名词和动词作为重点词的可能性大于形容词和副词,故赋予较大的权重值。重点词v的词性权重值设为class(v)。
[0065]
步骤22:对重点词的词向量,将该重点词对应的方差值以及词性作为权重,融合所有重点词的向量得到,重点词的词向量v的计算公式如以下公式(1)所示:
[0066][0067]
其中,class(v1)表示词向量为v1的分词的词性权重值,以此类推。
[0068]
需要说明的是,对于方差的计算参见上文,此处不再赘述。
[0069]
需要说明的是,对应的方差越大,表示该重点词(即关键词)越特殊,越具有区分度,因此将方差作为重点词权重的一部分,可以更为准确地评估该词的重要性。另外,最终得到的向量v,表示的是融合了所有重点词的信息的词向量,可理解为该向量v对应的目标关键词为该短信的重点所在。如此,可以通过将多个关键词进行融合,更为准确地得到第一消息的消息内容中的关键信息,从而提升后续分类的准确性。
[0070]
在另一种可能的实现方式中,消息分类装置将第一消息中的至少一个关键词通过信息熵以及词性进行融合。
[0071]
示例性地,消息分类装置可以在得到第一消息中的多个分词后,依次去除某个分词,计算去除该分词前后的消息内容的信息熵大小,如前后差值较大,则该词是重点词的可能性越高。
[0072]
需要说明的是,如果仅用重点词表达整条短信,则不能刻画短信的全貌,因为忽略了其他非重点词对短信分类的影响,所以需要把非重点词也考虑进来,这就引入到以下实
施例的步骤。
[0073]
可选地,在本技术实施例中,上述步骤203可以包括以下步骤203a:
[0074]
步骤203a:消息分类装置基于每个分词与目标关键词之间的第一关联信息,将n个分词与目标关键词进行词性融合,得到目标消息内容。
[0075]
可选地,上述每个分词与目标关键词之间的第一关联信息为:每个分词与目标关键词的相似度信息。
[0076]
示例性地,消息分类装置可以基于每个分词与目标关键词之间的相似度信息,将每个分词与目标关键词进行融合,得到目标消息内容。
[0077]
示例3,结合上述示例1和示例2,以第一消息中包括n+1个分词为例,上述词性融合过程可以包括以下步骤31至步骤35:
[0078]
步骤31:对第一消息中的所有分词,依次将每个分词的词向量wi和融合后的重点词向量v(即目标关键词的词向量)进行相似度计算。
[0079]
示例地,对于第一消息中的至少一个关键词,在计算其与目标关键词的相似度时,先对该至少一个关键词进行降权处理,具体的相似度计算方式为:计算关键词的词向量wi和融合后的目标重点词的词向量v的余弦相似度γ1=cosinesim(wi,v)。
[0080]
具体地,如果词向量wi是重点词向量(即关键词的词向量),则对余弦相似度进行衰减降权,对余弦相似度γ1进行降权处理的计算公式如下公式(2)所示:
[0081][0082]
其中,f
p
是该重点词在消息内容中出现的次数,即词频,α
p
和β
p
分别是可调整的超参数,和重点词的词性有关。该式的意义在于,出现越多的词,区分度越低,用词频和指数衰减函数相结合去衰减改词的作用。
[0083]
具体地,如果词语wi是非重点词向量,则对第一步计算得到的余弦相似度γ1进行升权或者不变,对余弦相似度γ1进行升权处理的计算公式如下公式(3)所示:
[0084][0085]
其中,fn是该非重点词在短信中出现的次数,αn是可调整的超参数。
[0086]
需要说明的是,对于第一消息的消息内容的全部分词中的重点词,它和融合后的和重点词向量v的相似度比非重点词要高。因此,为了提升非重点词对最终短信分类的影响,在计算相似度时,可以对重点词进行降权处理(即相似度衰减),避免后面的步骤会再次加大重点词的作用,弱化了非重点词的影响。
[0087]
步骤32:得到的所有分词的相似度值γi后,基于每个分词与目标关键词之间的相似度值γi,分别对每个分词与目标关键词进行处理,分别得到处理后的每个分词以及处理后的目标关键词。
[0088]
示例性地,消息分类装置可以将消息内容中每个分词依次和目标关键词计算相似度,然后基于每个分词与目标关键词的相似度信息,对每个分词进行处理。
[0089]
具体地,通过每个分词与目标关键词之间的相似度信息,对每个分词进行处理,得到处理后的每个分词,以在每个分词中融合目标关键词中的信息(重点信息),并通过上述相似度信息,对目标关键词进行处理,得到处理后的目标关键词,以在目标关键词中融合每
个分词(包括非重点词)的信息(即非重点信息)。如此,实现通过融合后的重点词去改变非重点词,以及通过非重点词去改变融合后的重点词,从而使得重点词与非重点词之间相互影响含义互通,提高对消息内容预测的准确性。
[0090]
示例性地,上述步骤32,可以包括以下步骤32a和步骤32b:
[0091]
步骤32a:分别将每个分词与目标关键词之间的相似度值γi,与每个分词的词向量wi相乘,得到w
con1
,w
con1
的计算公式如公式(4)所示:
[0092]wcon1
=γi×
wi+wi(4)
[0093]
步骤32b:将每个分词与目标关键词的相似度值γi,与目标关键词的词向量相乘,得到w
con2
,w
con2
的计算公式如公式(5)所示:
[0094]wcon2
=γi×
v(5)
[0095]
需要说明的是,由于相似度γi是结合词语向量wi公式(4)中,w
con1
前半部分是考虑重点词向量对该词语的影响程度之后得出的向量,后半部分是词向量本身,二者加起来,则把原来的词向量添加了重点词的特征,增加了原来词向量的信息量;w
con2
同理,表达的是词向量wi对重点向量v进行影响之后的向量。
[0096]
需要说明的是,上述步骤32a是针对非重点词和融合后的重点词的融合,目的是将重点词信息转入非重点词,从而帮助非重点词去刻画整个文本,增加非重点词的深度;上述步骤32b是针对重点词和融合后的重点词的融合,其目的是将非重点词信息转入重点词,帮助重点词去刻画整个文本,从而增加重点词的广度,因此,上述整个步骤32的目的是让消息内容中的每一个分词与融合后的重点词进行相互影响,互通各自包含的信息。
[0097]
步骤33:将上述步骤32得到的w
con1
和w
con2
拼接起来得到融合结果即对每个词向量wi,i=1,2,3,

,n+1,通过如下公式(6)作以下计算:
[0098][0099]
需要说明的是,上述步骤33的目的是:把每个分词的词向量和融合后的重点词向量作为一个整体,得到的向量既能反映短信中的重点信息,又不会一些看似不是那么重要的词语的信息。
[0100]
步骤34:由于上述步骤是对消息内容中的每一个分词依次做的操作,消息内容中有n+1个词语,就有n+1个向量,通过向量取平均把n+1个向量融合形成一个向量,计算公式如公式(7)所示:
[0101][0102]
步骤35:通过dnn网络把上述得到的向量w
all
收缩到一个维度,计算公式如下公式(8)所示。
[0103]wfinal
=dnn(w
all
)(8)
[0104]
需要说明的是,因为wall是通过拼接得到的,维度是向量v的两倍,因此需要通过dnn网络把两个向量收缩到一个维度才能进行后续操作。
[0105]
如此,通过将消息内容中的每个分词(包括重点词和非重点词)和融合后的重点词的融合,将重点词信息转入非重点词,从而帮助非重点词去刻画整个文本,增加非重点词的深度;并将非重点词信息转入重点词,帮助重点词去刻画整个文本,从而增加重点词的广
度,从而能够更为准确地得到消息内容中的关键(重点)信息,从而保证后续确定消息类型以消息分类的准确性。
[0106]
可选地,在本技术实施例中,上述步骤204可以包括以下步骤204a和步骤204b:
[0107]
步骤204a:消息分类装置预测上述目标消息内容对应于至少一个预设消息类型的概率信息。
[0108]
步骤204b:消息分类装置根据上述概率信息,从上述至少一个预设消息类型中确定出上述第一消息所属的消息类型。
[0109]
示例性地,消息分类装置可以通过预设分类模型,预测上述目标消息内容对应的消息类型,从而确定第一消息所属的消息类型。
[0110]
示例4,结合上述示例1至示例3,以至少一个预设消息类型包括:广告、通知和骚扰三个消息类型为例,上述根据概率信息确定第一消息所属的消息类型的步骤如下:
[0111]
在得到上述融合后的向量w
final
后,通过系数加权把全部分词和重点词的向量进行融合,再通过转换矩阵w得出广告、通知、骚扰三个类别的预测概率p=(a
×wfinal
+b
×
v)w,并取预测概率最大的类别为短信的最终分类,其中a和b是可调整的超参数。
[0112]
如此,消息分类装置可以通过预设分类模型,预测目标消息内容在每个预设消息类型下的概率信息,并将概率最大的类别确定为第一消息的消息类别,从而能够提高后续进行短信分类的准确性。
[0113]
可选地,在本技术实施例中,上述步骤204可以包括以下步骤204c:
[0114]
步骤204c:消息分类装置基于上述目标消息内容以及第一消息的联系人信息,确定第一消息的消息类型。
[0115]
可选地,上述第一消息的联系人信息为第一消息的发送方的信息。例如,第一消息为好友a通过其电子设备发送的短信,那么第一消息的联系人信息为该好友a的号码,昵称,头像等用户信息。
[0116]
示例性地,消息分类装置可以判断第一消息的联系人信息是否为在本地保存的联系人信息,若该联系人信息为已在本地保存的联系人信息,则确定该第一消息为来自本地联系人的消息,并将该第一消息归入本地联系人目录下,若该联系人信息为未在本地保存的联系人信息,则确定该第一消息为来自陌生联系人的消息,并将该第一消息归入非本地联系人目录下。
[0117]
具体地,假设第一消息为来自联系人b的短信,则将该联系人b的号码与通信录中的号码进行匹配,若匹配到,则说明该联系人b为本地联系人,将该短信保存至本地联系人目录下,若未匹配到,则说明该联系人为陌生联系人,则将短信保存至非本地联系人目录下。
[0118]
如此,消息分类装置在对第一消息分类时,可以根据第一消息的联系人信息,将第一消息归入本地联系人目录或者非本地联系人目录,使得用户可以直观地查看以及区分来自已知的联系人和未知的联系人的消息,从而方便用户后续对短信内容的筛选和查找。
[0119]
可选地,在本技术实施例中,上述步骤204之后,本技术实施例提供的消息分类方法还可以包括以下步骤205和步骤206:
[0120]
步骤205:消息分类装置基于第一文件夹中的各层级的文件的文件属性,从第一文件夹的各层级的文件中,确定与第一消息的消息类型匹配的目标文件。
[0121]
步骤206:消息分类装置将第一消息存入与第一消息的消息类型匹配的目标文件。
[0122]
其中,上述第一文件夹中的每个层级对应不同的消息类型。
[0123]
可选地,上述第一文件夹可以为一级目录,第一文件夹中的各层级的文件可以为一级目录下的子目录。
[0124]
可选地,上述各层级的文件指的是多级分类目录,以及每级分类目录下的多个子类别目录。示例性地,上述各层级的文件为预先设置的文件,具体地,上述各层级的文件为系统默认的,或者由用户自定义的,本技术实施例对此不做任何限定。
[0125]
示例性地,可以预先设置确定多级分类目录以及每级分类目录下多个子类别目录,并在接收到目录页面展示请求后,在显示界面以列表形式展示一级分类目录。示例性地,在大分类(即一级分类目录)上,通过第一消息对应的发件人的号码来源将第一消息划分为本地联系人、非本地联系人以及黑名单三个大类。进一步地,在非本地联系人这一类上,再划分为机构、个人两类。进一步地,在机构这一类上,划分成验证码、取件码、广告、通知和骚扰五个小类;进一步地,在个人这一分类上,划分成广告、通知和骚扰三个小类。
[0126]
示例性地,还可以通过其他维度来对消息进行划分,例如,根据情感维度将消息划分为平淡、柔和、愤怒、攻击等类别。这样可以在显示界面显示大的分类目录,并在每个大的分类目录下显示属于该分类目录的子分类目录,这样可以使分类结果一目了然,便于用户管理。
[0127]
可选地,上述文件的文件属性为该文件对应的消息类别,即该文件中可保存的消息类型,例如,文件属性为验证码,则说明该文件中保存的为验证码类型的消息;再例如,文件属性为广告,则说明该文件中保存的为广告类型的消息。
[0128]
示例性地,图2(a)、图2(b)、图2(c)和图2(d)为本技术实施例提供的各层级文件(即多级目录)的示意图,如图2(a)所示为短信主页面,该短信主页面中包括本地联系人、非本地联系人和黑名单三个文件夹;图2(b)所示为非本地联系人下页面,具体的,是在非本地联系人文件夹下设置了机构和个人两个文件(文件夹);图2(c)所示为机构下页面,具体的,是在机构文件夹下设置了验证码、取件码、广告、通知和骚扰五个文件夹;图2(d)所示为个人下页面,具体的,是在个人文件夹下设置了广告、通知和骚扰三个文件夹。
[0129]
示例地,结合上述图2(a)至图2(d),通过具体的示例对本技术实施例提供的消息分类方法进行详细说明,该示例可以包括以下步骤41至步骤45:
[0130]
步骤41:电子设备接收短信之后,判断该短信的发件人的号码检测发件人是否在黑名单中,若存在则直接归类到黑名单目录下,若不存在则进行以下步骤42。
[0131]
步骤42:判断发件人是否在本地联系人中,如果存在,则直接归入到本地联系人目录下,若不存在则进行以下步骤43。
[0132]
步骤43:判断发件人是机构还是个人,如果是机构则进行以下步骤44;如果为个人发送,进行以下步骤45。
[0133]
步骤44:使用正则表达式,检测出短信文本中是否存在数字码成分,若存在则根据验证码和取件码的格式把该短信归类到验证码或取件码目录下;若没有检测出数字码成分,则调用预设分类模型进一步预测该短信的消息类型。
[0134]
步骤45:若判定为通过个人发送,则进行短信文本清洗与处理,并调用预设分类模型进一步预测该短信的消息类型。
[0135]
需要说明的是,通过预设分类模型预测短信的消息类型的具体步骤可以参见上文,此处不再赘述。
[0136]
本技术实施提供了一种能够对接收到的第一消息进行有效分类的方法,按照消息的类别层级展示的方式会极大提升用户查找短信的效率,使得用户可以快速且准确地找到自己想要查看的信息,避免在每个发件人目录下进行无效搜寻,提升了搜索效率和使用体验。
[0137]
本技术实施例提供的消息分类方法,执行主体可以为消息分类装置。本技术实施例中以消息分类装置执行消息分类方法为例,说明本技术实施例提供的消息分类装置。
[0138]
如图3所示,本技术实施例提供一种消息分类装置的结构示意图,如图3所示,该装置300包括:获取模块301,生成模块302和确定模块303,其中:
[0139]
上述获取模块301,用于获取第一消息的消息内容;上述消息内容中包含n个分词;上述n个分词中包含至少一个关键词,n为正整数;
[0140]
上述生成模块302,用于对上述获取模块301获取的所述至少一个关键词进行词性融合,生成目标关键词;
[0141]
上述生成模块302,还用于将上述目标关键词与上述n个分词进行融合,得到目标消息内容;
[0142]
上述确定模块303,用于基于上述生成模块302得到的目标消息内容,确定第一消息的消息类型。
[0143]
可选地,在本技术实施例中,上述生成模块302,具体用于将第一分词与目标关键词进行融合,得到第一消息内容,并将至少一个关键词与目标关键词进行融合,得到第二消息内容;
[0144]
上述生成模块,具体用于基于每个所述分词与所述目标关键词之间的第一关联信息,将n个分词与目标关键词进行词性融合,得到目标消息内容。
[0145]
可选地,在本技术实施例中,上述生成模块302,用于基于每个关键词的描述信息,对至少一个关键词进行词性融合,生成目标关键词;
[0146]
其中,上述描述信息包括以下至少之一:
[0147]
关键词的词性信息;
[0148]
关键词与上述n个分词中其他分词间的关联信息。
[0149]
可选地,在本技术实施例中,
[0150]
上述确定模块303,用于预测生成模块302生成的目标消息内容对应于至少一个预设消息类型的概率信息;
[0151]
上述确定模块303,具体用于根据上述概率信息,从至少一个预设消息类型中确定出第一消息所属的消息类型。
[0152]
可选地,在本技术实施例中,
[0153]
上述确定模块303,具体用于基于上述生成模块302生成的目标消息内容以及上述第一消息对应的联系人信息,确定上述第一消息的消息类型。
[0154]
可选地,在本技术实施例中,上述装置还包括:保存模块304,上述确定模块,还用于基于第一文件夹中的各层级的文件的文件属性,从第一文件夹的各层级的文件中,确定与第一消息的消息类型匹配的目标文件;
[0155]
上述保存模块304,用于将第一消息存入确定模块303确定的与第一消息的消息类型匹配的目标文件;
[0156]
其中,上述第一文件夹中的每个层级对应不同的消息类型。
[0157]
在本技术实施例提供的消息分类装置中,消息分类装置获取第一消息的消息内容,该消息内容中包含n个分词,上述n个分词中包含至少一个关键词,对上述至少一个关键词进行词性融合,生成目标关键词,并将生成的目标关键词与上述n个分词进行融合,得到目标消息内容,然后基于上述目标消息内容,确定第一消息的消息类型,最后将上述第一消息存入与第一消息的消息类型匹配的目标文件。通过该方法,消息分类装置可以对第一消息中的关键词进行提取以及词性融合,从而得到融合第一消息中的关键词的信息的目标关键词,然后将该目标关键词与第一信息中的每个分词进行词性融合,从而得到融合第一信息中的关键词与非关键词的重点信息,并基于该重点信息确定第一消息的消息类型。如此,使得第一信息中的每一个分词与第一信息中的关键词互通各自包含的信息,能够准确地获取第一信息中包含的重点信息,从而能够提升确定的第一消息的消息类型的准确性,进而能够对消息进行有效分类,提高用户查看消息的便捷性。
[0158]
本技术实施例中的消息分类装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(mobile internet device,mid)、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,还可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
[0159]
本技术实施例中的消息分类装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0160]
本技术实施例提供的消息分类装置能够实现图1和图2的方法实施例实现的各个过程,为避免重复,这里不再赘述。
[0161]
可选地,如图4所示,本技术实施例还提供一种电子设备400,包括处理器401和存储器402,存储器402上存储有可在所述处理器401上运行的程序或指令,该程序或指令被处理器401执行时实现上述消息分类方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0162]
需要说明的是,本技术实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
[0163]
图5为实现本技术实施例的一种电子设备的硬件结构示意图。
[0164]
该电子设备100包括但不限于:射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、以及处理器110等部件。
[0165]
本领域技术人员可以理解,电子设备100还可以包括给各个部件供电的电源(比如
电池),电源可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
[0166]
其中,上述处理器110,用于获取第一消息的消息内容;上述消息内容中包含n个分词;上述n个分词中包含至少一个关键词,n为正整数;
[0167]
上述处理器110,用于对获取的所述至少一个关键词进行词性融合,生成目标关键词;
[0168]
上述处理器110,还用于将上述目标关键词与上述n个分词进行融合,得到目标消息内容;
[0169]
上述处理器110,用于基于上述得到的目标消息内容,确定第一消息的消息类型。
[0170]
可选地,在本技术实施例中,上述处理器110,具体用于基于每个分词与目标关键词之间的第一关联信息,将每个分词与目标关键词进行融合,得到目标消息内容。
[0171]
可选地,在本技术实施例中,上述生成模块302,用于基于每个关键词的描述信息,对至少一个关键词进行词性融合,生成目标关键词;
[0172]
其中,上述描述信息包括以下至少之一:
[0173]
关键词的词性信息;
[0174]
关键词与上述n个分词中其他分词间的关联信息。
[0175]
可选地,在本技术实施例中,
[0176]
上述处理器110,用于预测生成的目标消息内容对应于至少一个预设消息类型的概率信息;
[0177]
上述处理器110,具体用于根据上述概率信息,从至少一个预设消息类型中确定出第一消息所属的消息类型。
[0178]
可选地,在本技术实施例中,
[0179]
上述处理器110,具体用于基于上述生成的目标消息内容以及上述第一消息对应的联系人信息,确定上述第一消息的消息类型。
[0180]
可选地,在本技术实施例中,上述处理器110,还用于基于第一文件夹中的各层级的文件的文件属性,从第一文件夹的各层级的文件中,确定与第一消息的消息类型匹配的目标文件;
[0181]
上述存储器109,用于将第一消息存入处理器110确定的与第一消息的消息类型匹配的目标文件;
[0182]
其中,上述第一文件夹中的每个层级对应不同的消息类型。
[0183]
在本技术实施例提供的电子设备中,电子设备获取第一消息的消息内容,该消息内容中包含n个分词,上述n个分词中包含至少一个关键词,对上述至少一个关键词进行词性融合,生成目标关键词,并将生成的目标关键词与上述n个分词进行融合,得到目标消息内容,然后基于上述目标消息内容,确定第一消息的消息类型,最后将上述第一消息存入与第一消息的消息类型匹配的目标文件。通过该方法,电子设备可以对第一消息中的关键词进行提取以及词性融合,从而得到融合第一消息中的关键词的信息的目标关键词,然后将该目标关键词与第一信息中的每个分词进行词性融合,从而得到融合第一信息中的关键词
与非关键词的重点信息,并基于该重点信息确定第一消息的消息类型。如此,使得第一信息中的每一个分词与第一信息中的关键词互通各自包含的信息,能够准确地获取第一信息中包含的重点信息,从而能够提升确定的第一消息的消息类型的准确性,进而能够对消息进行有效分类,提高用户查看消息的便捷性。
[0184]
应理解的是,本技术实施例中,输入单元104可以包括图形处理器(graphics processing unit,gpu)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元106可包括显示面板1061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板1061。用户输入单元107包括触控面板1071以及其他输入设备1072中的至少一种。触控面板1071,也称为触摸屏。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
[0185]
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器109可以包括易失性存储器或非易失性存储器,或者,存储器x09可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本技术实施例中的存储器109包括但不限于这些和任意其它适合类型的存储器。
[0186]
处理器110可包括一个或多个处理单元;可选的,处理器110集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
[0187]
本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述消息分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0188]
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器rom、随机存取存储器ram、磁碟或者光盘等。
[0189]
本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述消息分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0190]
应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或
片上系统芯片等。
[0191]
本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述消息分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0192]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0193]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0194]
上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1