专利名称:电信业务推荐方法和系统的制作方法
技术领域:
本发明涉及通信技术,特别涉及一种电信业务推荐方法和系统。
背景技术:
现阶段我国电信业务面临同质化竞争的市场压力,使得发展新用户越来越困难; 电信运营商正逐步从以往的依赖价格战等竞争手段吸引用户的粗放式经营,向分众服务、 精细化经营转变,纷纷建设自己的数据挖掘系统来辅助进行精准营销。目前一般是基于电信用户的基本资料、地理位置、通信行为等数据的分析和挖掘, 从中发现业务运营规律,进而开展电信业务推荐。该方法的弊端是,没有考虑用户的兴趣爱好,用户的兴趣爱好无法直接从用户的基本资料、地理位置、通信行为等数据获得,可能出现用户对推荐的电信业务不感兴趣,既使得用户体验较差,又降低了电信业务推荐的成功率。
发明内容
本发明的目的是提供一种电信业务推荐方法和系统,以基于用户兴趣进行电信业务推荐,实现电信业务的精准营销。本发明提供一种电信业务推荐方法,包括获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。本发明提供一种电信业务推荐系统,包括用户数据采集模块、用户兴趣学习模块和电信业务推荐模块;所述用户数据采集模块,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;所述用户兴趣学习模块,用于根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;所述电信业务推荐模块,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。本发明的电信业务推荐方法和系统,通过对全业务运营环境下电信用户的上网行为的采集和分析,充分挖掘用户兴趣及其与电信业务之间的关联关系,基于用户兴趣开展电信业务推荐,实现电信业务的精准营销,同时提升用户体验。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明电信业务推荐系统实施例的结构示意图;图2为本发明电信业务推荐方法实施例的流程示意图;图3为本发明电信业务推荐方法实施例中的生成文本分类器的流程示意图;图4为本发明电信业务推荐方法实施例中的获得用户访问网页文档主题标引的流程示意图;图5为本发明电信业务推荐方法实施例中的获得用户兴趣和电信业务关联关系的流程示意图;图6为本发明电信业务推荐方法实施例中的电信业务推荐的流程示意图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例一图1为本发明电信业务推荐系统实施例的结构示意图,如图1所示,该系统可以包括用户数据采集模块11、用户兴趣学习模块12和电信业务推荐模块13 ;其中,所述用户数据采集模块11,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;该上网日志信息可以存储至用户上网日志库14。所述用户兴趣学习模块12,用于根据所述上网日志信息得到用户访问网页文档主题标引;根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;该用户兴趣模型可以存储至用户兴趣模型库15 ;所述电信业务推荐模块13,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐;该用户兴趣和电信业务的关联关系可以存储至兴趣-业务关联库16。例如,用户兴趣学习模块12可以包括判断单元、第一处理单元和第二处理单元; 其中,判断单元,用于根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL 地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;第一处理单元,用于在所述判断单元的判断结果为是时,直接获得所述主题标引;第二处理单元,用于在所述判断单元的判断结果为否时,使用网页采集器获取所述URL对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本
6分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。例如,用户兴趣学习模块12还可以包括第一兴趣单元和第二兴趣单元;其中,第一兴趣单元,用于根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量, 所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比;第二兴趣单元,用于对所述兴趣度进行正规化处理,得到正规兴趣度。例如,所述电信业务推荐模块包括集合单元、处理单元、关联单元、可信单元和推荐单元;集合单元,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;处理单元,用于计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;关联单元,用于根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度;可信单元,用于根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;推荐单元,用于根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。进一步的,还包括推荐评估模块17,用于对电信业务推荐的效果进行评估,得到评估结果;推荐优化模块18,用于根据所述评估结果,优化所述电信业务推荐。本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。实施例二图2为本发明电信业务推荐方法实施例的流程示意图,本实施例的电信业务推荐方法可以通过实施例一中所述的电信业务推荐系统执行,如图2所示,本实施例的方法可以包括以下步骤步骤201、用户数据采集模块获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;例如,可以由BSS/0SS系统采集用户身份信息、订购业务信息、电信业务信息等信息,由宽带接入服务器(Broadband Remote Access Server,简称BRAS)和远程用户拨号认证系统(Remote Authentication Dial In User Service,简称RADIUS)采集用户访问互联网的原始信息,得到用户访问URL的上网日志信息;该上网行为包括固网宽带、移动WAP/ Web上网等。所述的上网日志信息可以存储到用户上网日志库。其中,用户的身份信息用于用户数据采集模块从BRAS和RADIUS采集用户使用互
7联网的原始信息后的用户身份鉴别,以及用户爱好(由上网日志反映)和用户订购业务信息的关联关系挖掘;订购业务信息中可以包括订购业务数量、订购电信业务名称等;电信业务信息中可以包括电信业务总数、电信业务名称等;上网日志信息可以包括用户访问的 URL地址信息、某类日志的数量、以及访问该类日志的时间等。步骤202、用户兴趣学习模块根据所述上网日志信息得到用户访问网页文档的主题标引;例如,可以由上网日志信息中获得用户访问的URL地址,根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档主题是否已标引。在所述判断单元的判断结果为是时,直接获得所述主题标弓I。在所述判断单元的判断结果为否时,使用网页采集器,采集获得所述URL地址所对应的网页文档,即用户访问网页文档;对所述用户访问网页文档进行处理,得到用户访问网页文档主题标引;并将所述用户访问网页文档主题标引存储到所述URL-主题映射库。其中,对所述用户访问网页文档进行处理,得到用户访问网页文档主题标引,具体可以包括两部分内容;一部分是可以通过对有主题类别标注的分类训练文档库的文档进行文本分类训练,生成文本分类器,该部分内容具体可以参见实施例三中对文本分类训练的说明;另一部分是在对用户访问网页文档的处理过程中使用上述得到的文本分类器进行文本分类,从而得到用户访问网页文档的主题标引,该部分内容具体可以参见实施例四中获得用户访问网页文档主题标引的说明。步骤203、用户兴趣学习模块根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;例如,可以根据用户访问网页文档主题标引确定用户的兴趣数量,该用户兴趣模型中,可以包括多个兴趣项,其中,所述的兴趣项中可以包括兴趣类别名称和兴趣度等因素。该用户兴趣模型具体可以参见实施例五中对于用户兴趣模型的详细说明。生成的用户兴趣模型可以存储至用户兴趣模型库。步骤204、电信业务推荐模块根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;例如,可以根据步骤203中所建立的用户兴趣模型,以及步骤201中所获取的电信业务信息和订购业务信息等,通过计算和处理得到用户兴趣和电信业务之间的关联关系。 该关联关系的生成具体可以参见实施例六的说明。生成的兴趣-业务关联关系可以存储至兴趣-业务关联库中。步骤205、电信业务推荐模块根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。例如,在步骤204中得到用户兴趣和电信业务的关联关系之后,可以根据用户兴趣模型以及所述关联关系,得到推荐业务列表,对用户进行电信业务推荐。具体可以参见实施例七中对于电信业务推荐列表生成的说明。本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例三图3为本发明电信业务推荐方法实施例中的生成文本分类器的流程示意图,如图 3所示,本实施例可以包括以下步骤步骤301、用户兴趣学习模块对有类别标注的分类训练文档库的文档进行预处理, 得到规范化文本;例如,用户兴趣学习模块对有主题类别标注的分类训练文档库的文档进行预处理。其中,所述分类训练文档库可以由电信业务推荐系统的使用者自行建立,形式可以是一个名为“示例文档库”的大文件夹和一个名为“示例文档主题标引对照表”的文档或数据表。 所述示例文档库内是一些示例文档,所述示例文档主题标引对照表说明各示例文档的主题标引,如“体育”、“音乐”、“财经”等等。根据电信业务推荐的需要,文档主题的颗粒度可以再细化,如“体育”可以再细分为“足球”、“排球”等等。所述示例文档的格式不限,可以是txt 纯文本、web文本、word文本、ppt文本、pdf文本等等,txt和web类型以外的文档预处理时还需要做文档识别工作,因此建议系统使用者自行建立文档库时最好选择txt和web类型的示例文档。所述示例文档的语言不限,可以是中文文本、英文文本、中英文混合文本。在预处理时可以去除所述示例文本中的噪声,如广告条、导航条、书签等;并使用词法规则对英文文本进行词法分析,把变形后的词恢复原型,包括名词的复数去除、动词的时态转换、动词第三人称转换、词干抽取等,得到规范化的文本。步骤302、用户兴趣学习模块对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;例如,用户兴趣学习模块可以根据分词词典,对步骤301中得到的规范化文本进行中文分词和英文词组辨认,并根据停用词词典,去掉该规范化文本中的非分类信息词,即不含有分类信息的词,例如介词、带从句的副词、冠词、连词、代词、情态动词或语气助词等虚词,得到带分词标识文本。其中,分词就是使用划分符号,对文本进行以词或词组为单位的划分。划分符号可以是形如“\w”的标识符号。例如,“云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。,,采用“\w,,符号分词并去除非分类信息词后可得到“云计算 \wCloud Computing\w 分布式处理 \wDistributed Computing\w 并行处理 \w Parallel Computing\w 网格计算 \w Grid Computing\w 发展 \w 计算机 \w 科学 \w 概念 \w 商业\w实现W’。步骤303、用户兴趣学习模块对带分词标识文本进行词频统计和特征抽取,生成文本向量;例如,用户兴趣学习模块对步骤302得到的带分词标识的文本进行词频统计和特征抽取,得到特征向量空间,由此生成文本的向量空间模型,即生成文本向量。步骤304、用户兴趣学习模块对文本向量进行分类训练,获得文本分类时所需的参数,即生成文本分类器。本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。实施例四图4为本发明电信业务推荐方法实施例中的获得用户访问网页文档主题标引的流程示意图,如图4所示,本实施例可以包括以下步骤步骤401、用户兴趣学习模块获取用户访问的URL地址;例如,用户兴趣学习模块可以由用户上网日志库获取用户访问日志,其中包括URL 地址信息。步骤402、用户兴趣学习模块判断该URL地址所对应的网页文档主题是否已经标引;例如,用户兴趣学习模块可以查询URL-主题映射库,判断该URL地址所对应的网页文档主题是否已经标引;如果用户访问的网页文档主题已经标引,则执行步骤403;否则,如果用户访问的网页文档主题未标弓I,则执行步骤404 ;步骤403、用户兴趣学习模块获得用户访问网页文档主题标引;步骤404、用户兴趣学习模块使用网页采集器,获得步骤401中所获得的URL地址对应用户访问网页文档;步骤405、用户兴趣学习模块对用户访问网页文档进行预处理,得到规范化文本;例如,用户兴趣学习模块对步骤404中得到的用户访问网页文档进行预处理,该文档可以为web文本,在预处理时可以去除web文本中的噪声,如广告条、导航条、书签等; 并使用词法规则对英文文本进行词法分析,把变形后的词恢复原型,包括名词的复数去除、 动词的时态转换、动词第三人称转换、词干抽取等,得到规范化的文本。步骤406、用户兴趣学习模块对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;例如,用户兴趣学习模块可以根据分词词典,对步骤405中得到的规范化文本进行中文分词和英文词组辨认,并根据停用词词典,去掉该规范化文本中的非分类信息词,即不含有分类信息的词,例如介词、带从句的副词、冠词、连词、代词、情态动词或语气助词等虚词,得到带分词标识文本。步骤407、用户兴趣学习模块对带分词标识文本进行词频统计和特征抽取,生成文本向量;例如,用户兴趣学习模块根据实施例三中得到的特征向量空间,对步骤406得到的带分词标识的文本进行词频统计和特征权重计算,生成文本的向量空间模型,即生成文
本向量。步骤408、用户兴趣学习模块使用实施例三中得到的文本分类器,对步骤407中得到的文本向量进行文本分类,得到用户访问网页文档主题标引,并存储到URL-主题映射库中。其中,所述主题标引可用于生成用户兴趣模型。所述URL-主题映射库的作用是提高电信业务推荐系统的效率,例如,多个用户都浏览了同一个网页(URL地址相同),那么电信业务推荐系统只需要在用户首次访问时对这个URL地址指向的网页文档处理一次,后续其他用户再次访问时就可以直接通过查询该映射库得到网页文档对应的主题标引。本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。实施例五本实施例对实施例二中所述的用户兴趣模型进行详细说明用户兴趣模型 UserInterest定义如下式(1)所示
其中,m(0<m< |C|)是该用户的兴趣数量(即用户访问网页文档主题标引的数量),Icl是主题标引类别总数,(CijWijHi,^)是该用户的第i+l(0彡i <m)类兴趣项,Ci 是兴趣类别名称(即主题标引),Wi是Ci类兴趣的权重(兴趣度),ni是该用户上网访问日志中Ci类日志的数量,、是该用户上网访问日志中Ci类日志的最近出现时间。该用户的第i+1 (0 ^ i < m)类兴趣的权重(兴趣度)Wi定义如式(2)所示
“nI X0C \= /(r_, + J式 O)其中,η,是该用户上网访问日志中Ci类日志的数量,、是该用户上网访问日志中 Ci类日志的最近出现时间,T是当前系统时间,α >0是一个调整系数。式⑵的意义是, 由于用户的兴趣爱好会随时间的推移而动态变化,一些用户原本感兴趣的内容会随时间的推移而渐渐遗忘,新的兴趣会逐渐产生,因此用户的第i+l(0 ^ i <m)类兴趣的权重(兴趣度与用户感兴趣的Ci类网页文档数成正比,与最近阅览Ci类网页文档的时间差成反比。该兴趣度相当于引入了用户兴趣动态更新机制,实现了对用户兴趣的稳定和准确更新, 使得获得的用户兴趣爱好信息更加准确和及时,进一步提升用户体验,解决了用户兴趣漂移问题。其中,调整系统α值用于防止f(·)函数的分母为0,同时还可以调整兴趣度Wi 的衰减速度,α值越小,兴趣度Wi的衰减速度越快,因此可以根据具体需求确定α的取值。为防止兴趣度数据过度偏向于上网积极用户(即日志数量较大用户),因此需要正规化兴趣度数据。正规化后该用户的第i+Ι (0 ^ i < m)类兴趣的权重(兴趣度)冗定义如式⑶所示
一 W Wi =~rJ~式⑶
k=0其中,Wi由式(2)计算得到。用户兴趣学习模块会定期对用户兴趣模型进行更新,更新的方式即为根据上述的上网日志信息,如日志的主题、数量和时间等,对兴趣度进行更新。本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。实施例六
11
图5为本发明电信业务推荐方法实施例中的获得用户兴趣和电信业务关联关系的流程示意图,如图5所示,本实施例可以包括以下步骤步骤501、电信业务推荐模块根据用户兴趣模型、电信业务信息和订购业务信息, 建立二维带权记录集合;例如,电信业务推荐系统根据用户的订购业务信息、电信业务信息以及用户兴趣
模型库,建立二维带权记录集合T,其中,T = It1, t2,......,tn},其中η是系统内当前用户
数;T中的每个记录tu对应一个用户u的二维带权项集合々=k^,…力n,·^,…,^, 其中,mu(0<mu彡C|)是用户u的兴趣数量,|C|是系统主题标引类别总数,Cui是用户 u的第i+l(0彡i <mu)类兴趣名称,nu(0 <nu彡|S|)是该用户订购业务数量,|S|是电信业务总数,Suj是用户u的第j+1 (0彡j < nu)类电信业务名称,记录、对应的权重向量 K =(%。,…,Ku,凡,。,···,& —!),其中,wui是用户u正规化后Cui类兴趣的权重(0 ( i < mu),pUJ是用户u订购业务、的权重(0彡j < nu),根据系统需求,这里令puj = 1。步骤502、电信业务推荐模块计算所述集合中各类兴趣的支持度;例如,电信业务推荐系统根据式(4)和式( 计算二维带权记录集合T中各类兴趣 Ck (0 彡 k < Cl)的支持度 Support (Ck);
权利要求
1.一种电信业务推荐方法,其特征在于,包括获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
2.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述上网日志信息得到用户访问网页文档主题标引,包括根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;若是,则直接获得所述用户访问网页文档的主题标引;否则,使用网页采集器获取所述URL对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
3.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,包括所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量;所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比。
4.根据权利要求3所述的电信业务推荐方法,其特征在于,还包括对所述兴趣度进行正规化处理,得到正规兴趣度。
5.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系,包括根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度。
6.根据权利要求5所述的电信业务推荐方法,其特征在于,根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,包括根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。
7.根据权利要求1-6任一所述的电信业务推荐方法,其特征在于,还包括对电信业务推荐的效果进行评估,并根据所述评估结果,优化所述电信业务推荐。
8.一种电信业务推荐系统,其特征在于,包括用户数据采集模块、用户兴趣学习模块和电信业务推荐模块;所述用户数据采集模块,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;所述用户兴趣学习模块,用于根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;所述电信业务推荐模块,用于根据所述用户兴趣模型、电信业务信息和订购业务信息, 获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
9.根据权利要求8所述的电信业务推荐系统,其特征在于,所述用户兴趣学习模块包括判断单元,用于根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;第一处理单元,用于在所述判断单元的判断结果为是时,直接获得所述主题标引; 第二处理单元,用于在所述判断单元的判断结果为否时,使用网页采集器获取所述URL 对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
10.根据权利要求8所述的电信业务推荐系统,其特征在于,所述用户兴趣学习模块还包括第一兴趣单元,用于根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量;所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比; 第二兴趣单元,用于对所述兴趣度进行正规化处理,得到正规兴趣度。
11.根据权利要求8所述的电信业务推荐系统,其特征在于,所述电信业务推荐模块包括集合单元,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;处理单元,用于计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;关联单元,用于根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度;可信单元,用于根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;推荐单元,用于根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。
12.根据权利要求8-11任一所述的电信业务推荐系统,其特征在于,还包括 推荐评估模块,用于对用户进行电信业务推荐的效果进行评估,得到评估结果; 推荐优化模块,用于根据所述评估结果,优化所述电信业务推荐。
全文摘要
本发明提供一种电信业务推荐方法和系统,其中方法包括获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。本发明实现了电信业务的精准营销,同时提升用户体验。
文档编号H04M3/42GK102215300SQ20111013500
公开日2011年10月12日 申请日期2011年5月24日 优先权日2011年5月24日
发明者张云勇, 李卫, 郭志斌 申请人:中国联合网络通信集团有限公司