号码属性识别方法、装置、终端和服务器的制造方法_4

文档序号:8398565阅读:来源:国知局
,获取待识别的第一号码所对应的行为数据,第一号码对应的行为数据为第一号码所属的用户进行的通信行为过程中产生的数据。
[0127]属性识别模块1220,在识别模型为多个时,统计多个识别模型的分析结果中每一种属性的数量,根据数量高低从分析结果中选择第一号码的属性。根据本实施例的技术方案,综合多个识别模型的识别结果,有利于准确选择出第一号码的属性。
[0128]例如,根据图12,通过位于云端服务器的四种识别模型对号码H识别得到的识别结果——“个人号码”、“个人号码”、“个人号码”和“骚扰”(属性),根据识别结果设计投票:“个人号码” 3票,“骚扰” I票,所以确定号码H属于“个人号码”分类。
[0129]如图17所示,本发明的一个实施例中公开了一种号码属性识别装置,其包括:
[0130]行为数据获取模块1710,获取待识别的第一号码所对应的行为数据,第一号码对应的行为数据为第一号码所属的用户进行的通信行为过程中产生的数据。
[0131]第一概率计算模块1720,根据第一号码对应的每种行为数据,计算第一号码具有第一属性的概率。在本实施例中,对第一属性的类型不进行限制,其包括但不限于为第一号码增加的标签或分类等等。
[0132]第二概率计算模块1730,根据第一号码对应的多个行为数据各自对应的概率,计算共同对应的联合概率。在本实施例中,联合概率反映了多个行为同时存在的情况下,第一号码是否为第一属性的概率。
[0133]属性识别模块1740,根据联合概率的大小,判断第一号码是否具有第一属性。通过本实施例的技术方案,可以合理评估第一号码具有第一属性的可能性,在可能性较低时并不认为第一号码具有第一属性,以防止判断错误。
[0134]例如,根据图17,经统计对于号码I的近期的多次通话行为(通信行为)中,通话对象中通讯录联系人占比为20% (行为数据),呼入占比为30% (行为数据);根据通讯录联系占比,判断号码I为“骚扰类”(第一属性)号码的概率为60%,根据呼入占比判断号码I为“骚扰类”号码的概率为50%;经计算得到联合概率为80%;预设联合概率高于90%时,能够确定对应号码为“骚扰类”号码,所以此时不能确定号码I为“骚扰类”号码。
[0135]本发明的一个实施例中公开了一种号码属性识别装置,其包括:
[0136]行为数据获取模块1210,按预设的时间段,获取在每个时间段内产生的第一号码对应的行为数据。在本实施例中,对时间段的长短不进行限制,例如,一个时间段可以是一小时或一天。以及按预设的包含多个时间段的周期长短,累加多个周期中对应时间段内产生的第一号码对应的行为数据。在本实施例中,对周期的长短不进行限制,例如,一个周期可以是一周或一天。
[0137]属性识别模块1220,根据每次累加得到的行为数据,来识别第一号码的属性。在本实施例中,同样的通信行为如果发生在完全不同的时间段,可能产生完全不同的行为数据,因此完全不同的时间段内产生的行为数据累加到一起,反而体现不出用户在每个时间段内的特点;但单个时间段内得到的行为数据存在偶然性较大的问题;而本实施例中通过累加对应的多个时间段内产生的行为数据,既能体现该多个时间段的特点,又克服了偶然性的问题。
[0138]例如,根据图12,在一周内统计以小时(时间段)为单位统计号码J的呼出次数(行为数据),并累加每天(周期)中的11点-12点(对应时间段)时的呼出次数——15次、20次、20次、15次、20次、10次、10次,累加得到一周内11点-12点号码J的呼出次数为110次;由于11点-12点这个时间段是送餐时间,所以预设规则设计为一周内11点-12点呼出次数超过80次,可判断相应号码为“送餐”(属性)号码;所以可知号码J属于“送餐”类号码。
[0139]如图18所示,本发明的一个实施例中提供一种终端,其包括:图12至图17对应的任一实施例中的号码属性识别装置。本实施例中的终端包括但不限于手机、平板计算机等,通过前述实施例提供的号码属性识别装置,在终端接收到未知号码的来电或信息时,可以及时识别出未知号码的属性;该属性可以显示给用户参考是否接收未知号码的来电或阅读未知号码的信息;也可以根据该属性实现对位置号码来电或信息的自动处理,例如,识别为黑号码则自动将其来电拒接,以及将其信息屏蔽。
[0140]如图19所示,本发明的一个实施例中提供了一种服务器,其包括:行为数据接收模块1910,用于接收来自终端的待识别的号码对应的行为数据。图12至图17对应的任一实施例中的号码属性识别装置,用于根据号码的行为数据,识别出号码的属性。属性发送模块1920,将号码的属性发送给终端,以在终端上显示号码的属性。
[0141]根据本实施例的技术方案,基于前述实施例提供的号码属性识别装置,在终端接收到未知号码的来电或信息时,可将未知号码发送到服务器,由服务器及时识别出未知号码的属性,并通知给终端;该属性可以显示给用户参考是否接收未知号码的来电或阅读未知号码的信息;也可以根据该属性实现对位置号码来电或信息的自动处理,例如,识别为黑号码则自动将其来电拒接,以及将其信息屏蔽。
[0142]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0143]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0144]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0145]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0146]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0147]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的号码属性识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0148]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0149]Al、一种号码属性识别方法,其包括:
[0150]获取待识别的第一号码所对应的行为数据,所述第一号码对应的行为数据为所述第一号码所属的用户进行的通信行为过程中产生的数据;
[0151]使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对所述第一号码对应的行为数据进行计算,以得到所述第一号码的属性;其中所述第二号码对应的行为数据为所述第二号码所属的用户进行的通信行为过程中产生的数据。
[0152]A2、根据Al所述的方法,其中,获取待识别的第一号码所对应的行为数据,具体包括:
[0153]获取所述第一号码所属用户传输的文本信息,并从所述文本信息中提取词语作为所述第一号码对应的行为数据。
[0154]A3、根据A2所述的方法,其中,在从所述文本信息中提取词语作为所述第一号码对应的行为数据之前,还包括:
[0155]根据预设的过滤字符库,对所述文本信息中的字符进行过滤;所述过滤字符库中记录了需要过滤的字符。
[0156]A4、根据A2所述的方法,其中,在从所述文本信息中提取词语作为所述第一号码对应的行为数据之前,还包括:
[0157]根据预设的字符转换库在所述文本信息中查询是否具有待转换的字符,并在查找到所述待转换的字符时根据所述字符转换库进行转换;所述字符转换库中记录所述待转换的字符,以及与所述待转换的字符对应的转换后的字符。
[0158]A5、根据Al所述的方法,其中,获取待识别的第一号码所对应的行为数据,具体包括:
[0159]获取所述第一号码所属用户进行的多次通话行为的信息作为所述第一号码对应的行为数据。
[0160]A6、根据A5所述的方法,其中,所述第一号码对应的行为数据包括以下至少一种:
[0161]所述多次通话行为的通话时间、通话时长、被挂断占比、呼入占比、通讯录联系人占比、非长途通话占比、请求通话时向对方的平均请求次数。
[0162]A7、根据Al所述的方法,其中,在使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对所述第一号码对应的行为数据进行计算,以得到所述第一号码的属性之前,还包括:
[0163]获取所述第二号码的属性,以用于训练所述识别模块。
[0164]AS、根据A7所述的方法,其中,获取所述第二号码的属性,具体包括:
[0165]获取在特定时间段内产生的所述第二号码对应的标记数据,所述标记数据用于表示所述
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1