1.一种检测外文骚扰短信的方法,包括:
服务器将接收到的待识别短信输入预先训练的语言模型以确定所述待识别短信的语言种类为外语的概率;
当所述待识别短信的语言种类为外语的概率超过预定的外语概率阈值时,确定所述待识别短信的语言种类为外语;
将识别出的语言种类为外语的短信输入分类模型以获得输出结果;
若基于所述输出结果判别该短信为外语骚扰短信时,拦截该骚扰短信,以阻止相应的客户端接收到该骚扰短信。
2.根据权利要求1所述的方法,其中,服务器将接收到的待识别短信输入预先训练的语言模型以确定所述待识别短信的语言种类为外语的概率,包括:
通过预先训练的语言模型计算所述待识别短信中的每个单词中各个字母和/或多个相邻字母的语言种类为外语的子概率;
根据所述子概率,通过预定的概率算法计算确定所述待识别短信的语言种类为外语的概率。
3.根据权利要求2所述的方法,其中,预定的概率算法包括朴素贝叶斯算法。
4.根据权利要求1-3任一项所述的方法,将识别出的语言种类为外语的短信输入分类模型之前,还包括:
将识别出的语言种类为外语的短信中的至少一个单词进行词性和/或时态转换。
5.根据权利要求1-4任一项所述的方法,其中,将识别出的语言种类为外语的短信输入分类模型以获得输出结果,包括:
根据所述识别出的语言种类为外语的短信的内容提取出相应的外语特征数据;
将提取的所述外语特征数据输入所述分类模型进行训练;
获取所述分类模型的训练结果;
其中,所述短信的外语特征数据由短信的外文短语、单词、各个字母和/或多个相邻字母中的至少一项来构造。
6.根据权利要求1-5任一项所述的方法,还包括:
将判断所述待识别短信为骚扰短信的判断结果下发至相应的客户端。
7.一种客户端中检测外文骚扰短信的方法,包括:
将接收到的待识别短信输入预存的语言模型以确定所述待识别短信的语言种类为外语的概率;
当所述待识别短信的语言种类为外语的概率超过预定的外语概率阈值时,确定所述待识别短信的语言种类为外语;
将识别出的语言种类为外语的短信输入预存的分类模型以获得输出结果;
若基于所述输出结果判别该短信为外语骚扰短信时,对所述外语骚扰短信依据预设的处理规则进行相应处理。
8.根据权利要求7所述的方法,其中,将接收到的待识别短信输入预存的语言模型以确定所述待识别短信的语言种类为外语的概率,包括:
通过预存的语言模型计算所述待识别短信中的每个单词中各个字母和/或多个相邻字母的语言种类为外语的子概率;
根据所述子概率,通过预定的概率算法计算确定所述待识别短信的语言种类为外语的概率。
9.一种检测外文骚扰短信的装置,包括:
第一概率确定模块,用于服务器将接收到的待识别短信输入预先训练的语言模型以确定所述待识别短信的语言种类为外语的概率;
第一语言确定模块,用于当所述待识别短信的语言种类为外语的概率超过预定的外语概率阈值时,确定所述待识别短信的语言种类为外语;
第一输入模块,用于将识别出的语言种类为外语的短信输入分类模型以获得输出结果;
拦截模块,用于若基于所述输出结果判别该短信为外语骚扰短信时,拦截该骚扰短信,以阻止相应的客户端接收到该骚扰短信。
10.一种检测外文骚扰短信的客户端,包括:
第二概率确定模块,用于将接收到的待识别短信输入预存的语言模型以确定所述待识别短信的语言种类为外语的概率;
第二语言确定模块,用于当所述待识别短信的语言种类为外语的概率超过预定的外语概率阈值时,确定所述待识别短信的语言种类为外语;
第二输入模块,用于将识别出的语言种类为外语的短信输入预存的分类模型以获得输出结果;
处理模块,用于若基于所述输出结果判别该短信为外语骚扰短信时,对所述外语骚扰短信依据预设的处理规则进行相应处理。