1.本技术属于通信技术领域,尤其涉及一种家庭关系识别方法、装置、设备、介质及产品。
背景技术:2.随着移动通信的发展,各大电信运营商陆续开始开拓家庭用户市场,家庭用户市场除了存在手机通信卡、家庭短号网等业务外,还有家庭宽带,以及针对家庭宽带的家庭智能设备等业务,因此家庭用户市场具有广阔的增长空间。
3.相关技术中,基于家庭用户市场的开拓需要,对家庭用户和家庭成员之间关系的识别是重点。因此,如何从海量用户群中准确识别出家庭用户,以及家庭成员之间的家庭关系,是当前亟需解决的问题。
技术实现要素:4.本技术实施例提供一种家庭关系识别方法、装置、设备、介质及产品,能够解决如何从海量用户群中准确识别出家庭用户,以及家庭成员之间的家庭关系的问题。
5.第一方面,本技术实施例提供一种家庭关系识别方法,该方法包括:在获取到多个用户的指标数据的情况下,根据指标数据和家庭关系对识别模型,确定多个用户中存在家庭关系的多个用户对,其中,每个用户对对应两个用户;根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组,其中,每个第一家庭群组中至少包括一个用户对,第一家庭群组对应的用户为第一用户;获取每个第一家庭群组对应的第一用户的常驻基站数据;根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,得到每个第一家庭群组对应的至少一个第二家庭群组,其中,第二家庭群组对应的用户为第二用户,同一第二家庭群组的所有第二用户对应的居住小区信息相同;获取每个第二家庭群组对应的第二用户的目标数据,目标数据包括个体指标、业务行为数据中的至少一项;根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系。
6.第二方面,本技术实施例提供了一种家庭关系识别装置,该装置包括:确定模块,用于在获取到多个用户的指标数据的情况下,根据指标数据和家庭关系对识别模型,确定多个用户中存在家庭关系的多个用户对,其中,每个用户对对应两个用户;划分模块,用于根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组,其中,每个第一家庭群组中至少包括一个用户对,第一家庭群组对应的用户为第一用户;获取模块,用于获取每个第一家庭群组对应的第一用户的常驻基站数据;拆分模块,与根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,得到每个第一家庭群组对应的至少一个第二家庭群组,其中,第二家庭群组对应的用户为第二用户,同一第二家庭群组的所有第二用户对应的居住小区信息相同;获取模块,还用于获取每个第二家庭群组对应的第二用户的目标数据,目标数据包括个体指标、业务行为数据中的至少一项;识别模块,用于根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系。
7.第三方面,本技术实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面的任一项实施例中所示的家庭关系识别方法的步骤。
8.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的任一项实施例中所示的家庭关系识别方法的步骤。
9.第五方面,本技术实施例提供了一种计算机程序产品,程序产品被存储在非易失的存储介质中,程序产品被至少一个处理器执行以实现如第一方面的任一项实施例中所示的家庭关系识别方法的步骤。
10.本技术实施例的家庭关系识别方法、装置、设备、介质及产品,在获取到多个用户的指标数据的情况下,可以根据指标数据和家庭关系对识别模型,初步确定多个用户中存在家庭关系的多个用户对,并根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。基于此,为了提升家庭用户识别的准确性,获取每个第一家庭群组对应的第一用户的常驻基站数据,并根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,将每个第一家庭群组中居住小区信息相同的第一用户划分至同一家庭群组,得到第二家庭群组。由于第二家庭群组是在第一家庭群组的基础上,依据用户所在居住小区是否一致来划分的,因此能够在第一家庭群组的基础上进一步优化,保证第二家庭群组中的家庭成员能够存在实际家庭关系,有效提升家庭用户的识别准确性。这样,通过获取每个第二家庭群组对应的第二用户的个体指标、业务行为数据中的至少一项,能够依据每个第二用户的个体指标和/或业务行为数据,对每个第二家庭群组中所有第二用户的家庭关系进行精准识别,提升家庭用户和家庭关系的识别准确度。
附图说明
11.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
12.图1是本技术实施例提供的家庭关系识别方法的流程示意图之一;
13.图2是本技术实施例提供的家庭关系识别方法的流程示意图之二;
14.图3是本技术实施例提供的家庭关系识别方法的流程示意图之三;
15.图4是本技术实施例提供的家庭关系识别方法的流程示意图之四;
16.图5是本技术实施例提供的家庭关系识别方法的流程示意图之五;
17.图6是本技术实施例提供的家庭关系识别方法的流程示意图之六;
18.图7是本技术实施例提供的一种家庭关系识别装置的结构示意图;
19.图8是本技术实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
20.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领
域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
21.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
22.如背景技术,基于家庭用户市场的开拓需要,对家庭用户和家庭成员之间关系的识别是重点。因此,如何从海量用户群中准确识别出家庭用户,以及家庭成员之间的家庭关系,是当前亟需解决的问题。
23.针对相关技术中出现的问题,本技术实施例提供了一种家庭关系识别方法,在获取到多个用户的指标数据的情况下,可以根据指标数据和家庭关系对识别模型,初步确定多个用户中存在家庭关系的多个用户对,并根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。基于此,为了提升家庭用户识别的准确性,获取每个第一家庭群组对应的第一用户的常驻基站数据,并根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,将每个第一家庭群组中居住小区信息相同的第一用户划分至同一家庭群组,得到第二家庭群组。由于第二家庭群组是在第一家庭群组的基础上,依据用户所在居住小区是否一致来划分的,因此能够在第一家庭群组的基础上进一步优化,保证第二家庭群组中的家庭成员能够存在实际家庭关系,有效提升家庭用户的识别准确性。这样,通过获取每个第二家庭群组对应的第二用户的个体指标、业务行为数据中的至少一项,能够依据每个第二用户的个体指标和/或业务行为数据,对每个第二家庭群组中所有第二用户的家庭关系进行精准识别,提升家庭用户和家庭关系的识别准确度,解决了相关技术中如何从海量用户群中准确识别出家庭用户,以及家庭成员之间的家庭关系的问题。
24.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的家庭关系识别方法进行详细地说明。
25.需要说明的是,本技术实施例中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
26.图1是本技术实施例提供的一种家庭关系识别方法的流程示意图,该家庭关系识别方法的执行主体可以为电子设备。需要说明的是,上述执行主体并不构成对本技术的限定。
27.在这里,电子设备可以为手机、平板电脑、一体机等具有通讯功能的设备,也可以为虚拟机或模拟器模拟的设备,当然,还可以为云服务器或者服务器集群等具有存储以及计算功能的设备。
28.如图1所示,本技术实施例提供的家庭关系识别方法可以包括步骤110-步骤160。
29.步骤110,在获取到多个用户的指标数据的情况下,根据指标数据和家庭关系对识别模型,确定多个用户中存在家庭关系的多个用户对。
30.具体地,多个用户可以被划分为多组,每组包括两个用户,电子设备可以向家庭关
系识别模型输入每组用户的指标数据,该家庭关系识别模型可以基于每组用户的指标数据,识别该组用户是否具有家庭关系,并输出每组用户对应的正/负标签,当一组用户对应正标签时,确定该组用户为存在家庭关系的用户对。可以理解的是,每组包括两个用户,因此每个用户对对应两个用户。
31.步骤120,根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。
32.其中,每个第一家庭群组中至少包括一个用户对,第一家庭群组对应的用户为第一用户,该第一家庭群组可以用于表征物理家庭群组。
33.示例性地,多个用户对可以包括{用户a,用户b}、{用户c,用户d}、{用户c,用户e}、{用户a,用户p}则根据社群划分模型对4个用户对进行社群划分之后,可以得到两个第一家庭群组{用户a,用户b,用户p}、{用户c,用户d,用户e}。
34.步骤130,获取每个第一家庭群组对应的第一用户的常驻基站数据。
35.步骤140,根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,得到每个第一家庭群组对应的至少一个第二家庭群组。
36.其中,第二家庭群组对应的用户为第二用户,同一第二家庭群组的所有第二用户对应的居住小区信息相同,第二家庭群组可以用于表征“自然家庭群组”。
37.示例性地,第一家庭群组可以为{用户a,用户b,用户p},由于用户a与用户b的居住小区信息相同,用户p与用户a、b的居住小区信息不同,因此将{用户a,用户b,用户p}拆分为两个第二家庭群组{用户a,用户b}、{用户p}。
38.在本技术实施例中,由于家庭关系对识别模型在识别过程中可能存在误差,识别出的用户对不一定是真正存在家庭关系的。例如具有同事关系的用户a和用户p经常通话,家庭关系对识别模型基于两个用户的通话数据可以确定该组用户为用户对{用户a,用户p},因此在进行社群划分时,可能会将用户p与真正存在家庭关系的用户对{用户a,用户b}划分到一起,得到第一家庭群组{用户a,用户b,用户p}。因此,为了能够将真正具有家庭关系的用户归类到一起,电子设备可以基于居住小区信息对第一家庭群组进行拆分,将居住小区信息相同的第二用户划分至同一第二家庭群组,保证第二家庭群组中所有第二用户具有真实的家庭关系,提升家庭用户的识别准确性。同时,虽然第一家庭群组中的所有第一用户可能存在真实家庭关系,但运营商的家庭宽带等家庭业务,通常是针对同一住所的家庭用户所开展的。因此,对于具有家庭关系但住所不同的“大家庭”(即第一家庭群组),电子设备可以基于居住小区信息对其进行拆分,将“大家庭”拆分为对应同一住所的“小家庭”,识别出真正意义上的同一住所的“家庭用户”,便于运营商后续针对家庭用户的家庭业务的开展。
39.步骤150,获取每个第二家庭群组对应的第二用户的目标数据。
40.其中,该目标数据包括个体指标、业务行为数据中的至少一项。
41.步骤160,根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系。
42.本技术实施例提供的家庭关系识别方法,在获取到多个用户的指标数据的情况下,可以根据指标数据和家庭关系对识别模型,初步确定多个用户中存在家庭关系的多个用户对,并根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。基于
此,为了提升家庭用户识别的准确性,获取每个第一家庭群组对应的第一用户的常驻基站数据,并根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,将每个第一家庭群组中居住小区信息相同的第一用户划分至同一家庭群组,得到第二家庭群组。由于第二家庭群组是在第一家庭群组的基础上,依据用户所在居住小区是否一致来划分的,因此能够在第一家庭群组的基础上进一步优化,保证第二家庭群组中的家庭成员能够存在实际家庭关系,有效提升家庭用户的识别准确性。这样,通过获取每个第二家庭群组对应的第二用户的个体指标、业务行为数据中的至少一项,能够依据每个第二用户的个体指标和/或业务行为数据,对每个第二家庭群组中所有第二用户的家庭关系进行精准识别,提升家庭用户和家庭关系的识别准确度。
43.下面结合具体的实施例,详细说明上述步骤110-步骤130的具体实现方式。
44.涉及步骤110,在获取到多个用户的指标数据的情况下,根据指标数据和家庭关系对识别模型,确定多个用户中存在家庭关系的多个用户对。
45.在本技术的一些实施例中,指标数据可以包括以下至少一项:通话时长、通话次数、通话天数、通话周数、通话时长占比、通话次数占比、通话周数占比、交往指数、影响力、亲密度。
46.在本技术的一些实施例中,图2是本技术实施例提供的另一种家庭关系识别方法的流程示意图,在步骤110之前,该方法还可以包括图2所示的步骤210-步骤250。
47.步骤210,在获取到第一样本用户的业务办理信息和住址信息的情况下,根据业务办理信息和住址信息确定与第一样本用户存在家庭关系的第二样本用户,得到第一样本用户对。
48.其中,第一样本用户可以为业务办理用户,第二样本用户可以为与第一样本用户的办理业务关联的用户。
49.具体地,电子设备可以基于第一样本用户的业务办理信息,确定与第一样本用户所办理业务关联的用户集合,并且,电子设备可以依据第一样本用户的住址信息,确定用户集合中与第一样本用户的住址相同的第二样本用户,从而准确确定出与第一样本用户存在家庭关系的第二样本用户。
50.示例性地,第一样本用户可以为办理了共享语音类业务(例如亲情号)、家庭群组类业务(例如家庭宽带)或其它关联业务的用户。
51.在一个实施例中,第二样本用户可以为第一样本用户关联的智能网关识别出的用户。
52.步骤220,在获取到第三样本用户的通话数据的情况下,根据通话数据确定通话行为特征。
53.其中,第三样本用户可以为非业务办理用户。
54.具体地,电子设备可以基于第三样本用户的语音详单构建特征,运用统计学方法扩展特征向量,挖掘出用户的通话行为特征,该通话行为特征可以包括但不限于:通话时长、通话次数、通话天数、通话周数、通话时长占比、通话次数占比、通话周数占比、交往指数、影响力、亲密度。
55.在一个实施例中,在通过交往指数、影响力来计算亲密度指标时,可以根据公式(1)进行标准化变换处理。
[0056][0057]
其中,x
normal
表示标准化之后的数据,x表示原始数据,表示数据均值,sd(x)表示数据的标准差。
[0058]
在本技术实施例中,通过对原始数据进行标准化变换处理,能够去除指标的度量单位影响(去量纲化),提升亲密度计算的准确度。
[0059]
在一个实施例中,电子设备可以通过数据挖掘算法进行第三样本用户的家庭群组识别,确定与第三样本用户存在家庭关系的第四样本用户。
[0060]
步骤230,根据通话行为特征确定与第三样本用户存在家庭关系的第四样本用户,得到第二样本用户对。
[0061]
步骤240,获取第一样本用户对和第二样本用户对的指标数据,得到训练数据集。
[0062]
步骤250,基于训练数据集对逻辑回归模型进行训练,得到家庭关系对识别模型。
[0063]
具体地,电子设备可以将第一样本用户对和第二样本用户对的指标数据作为模型输入数据,将正标签作为模型输出数据,对逻辑回归模型进行模型训练,得到训练好的逻辑回归模型,即庭关系对识别模型。
[0064]
在本技术实施例中,考虑到本次模型分析对象规模大(全量客户),指标计算量复杂,因此选用计算量小、速度快、存储资源低、易于解释等优点的逻辑回归算法搭建模型,提升家庭关系对识别模型的训练效率和性能。
[0065]
涉及步骤120,根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。
[0066]
在一个实施例中,该社群划分模型可以采用社群发现louvain算法对多个用户对进行社群划分,该louvain算法是一种基于多层次优化modularity的算法,被认为是性能最好的社区发现算法之一,其优化的目标是最大化整个图属性结构(社区网络)的模块度(modularity),modularity函数最初被用于衡量社区发现算法结果的质量。
[0067]
在一个实施例中,louvain社群发现算法的步骤可以包括:步骤1,不断遍历网络中的节点,尝试将单个节点加入能够使modularity提升最大的社群,直至所有节点都不再变化;步骤2,处理步骤1的结果,将一个小小的社群归并为一个超节点来重新构造网络,这时边的权重为两个节点内所有原始节点的边权重之和;步骤3,迭代步骤1和步骤2直至算法稳定。
[0068]
在本技术实施例中,社群划分模型通过采用社群内部节点连接相对紧密、社群间连接相对稀疏louvain算法,能够大大提高群组划分的运行速度,并能够刻画发现的社区的紧密程度,将家庭群组识别到物理家庭层面,快速、准确地实现多个用户对的社群划分。
[0069]
涉及步骤130,获取每个第一家庭群组对应的第一用户的常驻基站数据。
[0070]
在一个实施例中,电子设备通过数据转化与累积可定位全量用户不同时段的常驻基站,得到全量用户的常驻基站数据,电子设备可以从全量用户的常驻基站数据中,获取第一用户的常驻基站数据。
[0071]
涉及步骤140,根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,得到每个第一家庭群组对应的至少一个第二家庭群组。
[0072]
在本技术的一些实施例中,图3是本技术实施例提供的再一种家庭关系识别方法
的流程示意图,步骤140可以包括图3所示的步骤310和步骤320。
[0073]
步骤310,根据每个第一用户的常驻基站数据确定每个第一用户的居住小区信息。
[0074]
在本技术的一些实施例中,为了确定每个第一用户的居住小区信息,图4是本技术实施例提供的再一种家庭关系识别方法的流程示意图,步骤310可以包括图4所示的步骤411-步骤421。
[0075]
步骤411,确定所有第一用户中的第五用户。
[0076]
其中,该第五用户可以为已办理宽带业务的用户。
[0077]
步骤412,根据第五用户的常驻基站数据确定第五用户的夜间常驻基站。
[0078]
步骤413,获取与夜间常驻基站对应的居住小区信息作为第五用户的居住小区信息。
[0079]
具体地,预设数据库中可以存储基站数据与居民小区信息的映射关系,电子设备可以基于每个第五用户的夜间常驻基站的基站数据,从预设数据库中获取与该基站数据存在映射关系的居民小区信息作为第五用户的居住小区信息。
[0080]
其中,该基站数据可以包括基站位置区码、基站小区定位信息、基站经纬度,居民小区信息可以包括小区名称、小区六级地址、小区经纬度。
[0081]
在一个实施例中,在电子设备未获取到与夜间常驻基站对应的居住小区信息的情况下,可以获取预设覆盖居民小区的位置信息,根据夜间常驻基站和预设覆盖居民小区的位置信息,确定预设覆盖居民小区中与夜间常驻基站距离最近的居住小区的信息为第五用户的居住小区信息。
[0082]
在上述实施例中,若与夜间常驻基站距离最近的居住小区包括至少两个,则可以选取小区宽带覆盖人数最多的居住小区的信息为第五用户的居住小区信息。
[0083]
步骤414,确定所有第一用户中的第六用户。
[0084]
其中,第六用户为所有第一用户中除第五用户以外的用户,即未本利宽带业务的用户。
[0085]
步骤415,根据第六用户的常驻基站数据,确定第六用户中与第一常驻基站建立过连接关系的第一目标用户。
[0086]
其中,第一常驻基站可以为第五用户对应的任意夜间常驻基站。
[0087]
步骤416,获取与第一常驻基站对应的居住小区信息作为第一目标用户的居住小区信息。
[0088]
具体地,针对未办理宽带业务,但是曾出现在已办理宽带业务用户(即第五用户)的夜间常驻基站(即第一常驻基站)的用户(即第一目标用户),可将该第一目标用户落到第一常驻基站对应的小区六级地址,得到第一目标用户的居住小区信息。
[0089]
在一个实施例中,电子设备可以将第五用户的小区六级地址和夜间常驻基站数据通过号码匹配,获得小区六级地址与夜间常驻基站数据的对应关系。电子设备可以从该对应关系中获取与第一常驻基站对应的小区六级地址,得到第一目标用户的居住小区信息。
[0090]
步骤417,确定第六用户中的第二目标用户。
[0091]
其中,第二目标用户可以为第六用户中除第一目标用户以外的用户。
[0092]
步骤418,从第二目标用户的常驻基站数据中,获取第二目标用户对应的第二常驻基站的位置信息。
[0093]
步骤419,获取预设覆盖居民小区的位置信息。
[0094]
其中,预设覆盖居民小区可以为宽带已覆盖小区。
[0095]
步骤420,根据第二常驻基站和预设覆盖居民小区的位置信息,确定预设覆盖居民小区中与第二常驻基站距离最近的目标居住小区。
[0096]
在一个实施例中,电子设备可以从预设覆盖居民小区中,获取与第二常驻基站的经度和纬度小数点后两位相差0.01的居民小区集合(实际距离大概在1公里左右),然后计算第二常驻基站与居民小区中每一个居民小区的经纬度之间的距离,筛选出距离最近的居民小区作为目标居住小区。
[0097]
在本技术实施例中,电子设备先基于经纬度筛选所有覆盖居民小区中,与第二常驻基站距离较近的居民小区集合,可以缩小范围。基于此,计算第二常驻基站与居民小区集合中居民小区的经纬度距离,可以明显降低计算量,提升识别和匹配效率。
[0098]
步骤421,获取目标居住小区的居住小区信息作为第二目标用户的居住小区信息。
[0099]
在一个实施例中,可以在步骤411之前构建用户落小区模型,电子设备通过该用户落小区模型执行上述步骤411-步骤421。
[0100]
步骤320,将每个第一家庭群组中居住小区信息相同的第一用户划分至同一第二家庭群组,得到每个第一家庭群组对应的至少一个第二家庭群组。
[0101]
示例性地,第一家庭群组可以为{用户d,用户e,用户q},由于用户d与用户e的居住小区信息相同,用户q与用户d、e的居住小区信息不同,因此将{用户d,用户e,用户q}拆分为两个第二家庭群组{用户d,用户e}、{用户q}。
[0102]
在本技术的一些实施例中,存在第一家庭群组中的多个第二用户居住在同一小区,但由于某一第二用户的常驻地基站落到了隔壁小区,因此多个第二用户因电子设备获取到的居住小区信息不同而被划分至不同第二家庭群组的现象,此时电子设备获取到的第二用户的居住小区信息存在误差,因此在基于居住小区信息对第一家庭群组进行划分时,会存在划分不准确的问题。
[0103]
基于此,图5是本技术实施例提供的再一种家庭关系识别方法的流程示意图,如图5所示,在步骤320之后,该方法可以包括步骤510-步骤530。
[0104]
步骤510,确定至少一个第二家庭群组中的第三家庭群组和第四家庭群组。
[0105]
其中,第三家庭群组中第二用户的数量小于预设数量阈值,第四家庭群组中第二用户的数量大于或等于预设数量阈值,该预设数量阈值可以基于具体需求进行设置,本技术在此不作具体限定。
[0106]
示例性地,预设数量阈值为2,则第一家庭群组{用户d,用户e,用户q}拆分为两个第二家庭群组{用户d,用户e}、{用户q}之后,由于{用户q}中第二用户数量小于2,因此电子设备确定第三家庭群组为{用户q},第四家庭群组为{用户d,用户e}。
[0107]
步骤520,根据第三家庭群组和第四家庭群组分别对应的居住小区信息,计算第三家庭群组与第四家庭群组对应居住小区之间的距离。
[0108]
具体地,电子设备可以基于第三家庭群组和第四家庭群组分别对应的居住小区的经纬度,计算两个居住小区之间的距离,其中,第三家庭群组对应的居住小区即为第三家庭群组中第二用户对应的居住小区,第四家庭群组对应的居住小区即为第四家庭群组中第二用户对应的居住小区。
[0109]
在一个实施例中,电子设备可以具体通过公式(2)和公式(3)计算第三家庭群组与第四家庭群组对应居住小区之间的距离distance。
[0110]
c=sin(lata)*sin(latb)*cos(lona-lonb)+cos(lata)*cos(latb)
ꢀꢀꢀ
(2)
[0111]
distance=r*arccos(c)*pi/180
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0112]
其中,第三家庭群组对应的居住小区的经纬度为(lona,lata),第四家庭群组对应的居住小区的经纬度为(lonb,latb),r为地球平均半径,c为中间值。
[0113]
步骤530,在距离小于预设距离阈值的情况下,合并第三家庭群组与第四家庭群组。
[0114]
其中,预设距离阈值可以根据实际需求进行设置,本技术在此不作具体限定。
[0115]
例如,预设距离阈值可以为3m、5m或8m等。
[0116]
在本技术实施例中,当第三家庭用户群组的数量小于预设数量阈值时,例如为1时,说明某一第二用户被划分至单人组。因此,电子设备可以计算该第二用户对应的居住小区与其他第二家庭群组(即第四家庭群组)中第二用户的居住小区之间的距离,通过距离来重新判断该第二用户归属的自然家庭群组。当该距离小于预设距离阈值时,说明两个第二家庭群组(第三家庭群组与第四家庭群组)中第二用户的居住小区距离很近,此时可以将两个第二家庭群组进行合并,使其合并为同一自然家庭群组,提升自然家庭群组划分的准确性。
[0117]
涉及步骤150,获取每个第二家庭群组对应的第二用户的目标数据。
[0118]
其中,该目标数据可以包括个体指标、业务行为数据中的至少一项。
[0119]
涉及步骤160,根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系。
[0120]
在本技术的一些实施例中,个体指标包括年龄数据、性别数据,业务行为数据可以包括应用程序使用数据,图6是本技术实施例提供的再一种家庭关系识别方法的流程示意图,步骤160可以包括图6所示的步骤610和步骤620。
[0121]
步骤610,基于每个第二家庭群组对应的目标数据绘制维度交叉矩阵。
[0122]
步骤620,基于维度交叉矩阵确定每个第二家庭群组中所有第二用户的家庭关系,得到每个第二用户的角色信息。
[0123]
在一个实施例中,电子设备可以基于年龄数据和性别数据绘制维度交叉矩阵,即电子设备将每个第二家庭群组中任意两个第二用户的年龄和性别标识分别相减,其中,不同年龄差值、不同性别标识差值对应不同的家庭关系类型。
[0124]
可选地,男性标识为1,女性标识为0。
[0125]
示例性地,男性标识为1,女性标识为0,第二家庭群组中的第二用户包括用户d和用户e,用户d与用户e的年龄分别为32、6,性别标识均为1。则基于年龄差值26和性别标识差值0,可以确定用户d与用户e的家庭关系类型为父子,用户d的家庭角色为父亲,用户e的家庭角色为儿子。
[0126]
在另一个实施例中,电子设备可以基于应用程序使用数据绘制维度交叉矩阵,基于第二用户的应用程序使用数据可以确定第二用户所使用的应用程序类别,从而判断该第二用户的家庭角色,得到任意两个第二用户的家庭关系。
[0127]
示例性地,用户d的应用程序使用数据中包括对办公类app的使用数据,用户e的应
用程序使用数据中包括对作业辅导类app的使用数据,则可以判断用户d的家庭角色为家长,用户e的家庭角色为孩子,从而得到任意用户d与用户e的家庭关系。
[0128]
在本技术实施例中,电子设备可以获取每个第二家庭群组对应的第二用户的年龄数据、性别数据或者app使用数据,通过上述用户的个人基础信息或网络行为信息绘制维度交叉矩阵,可以依据维度交叉矩阵准确确定同一自然家庭群组中家庭成员之间的家庭关系,以便于运营商后续有针对性地进行家庭业务推荐。
[0129]
在本技术的一些实施例中,步骤160之后,该方法还可以包括下述步骤:获取第二家庭群组中每个第二用户的流量使用数据和语音使用数据;根据流量使用数据和语音使用数据,确定第二家庭群组对应的家庭业务饱和度;基于家庭业务饱和度和第二家庭群组中所有第二用户的家庭关系,确定家庭画像。
[0130]
具体地,通过对家庭成员的产品中流量、语音套内使用业务量进行整体评估,可输出家庭业务饱和度,从而进一步提升全网家庭画像能力,实现以家庭为单位的特征提取及应用。
[0131]
需要说明的是,本技术实施例提供的家庭关系识别方法,执行主体可以为家庭关系识别装置,或者该家庭关系识别装置中的用于执行家庭关系识别方法的控制模块。本技术实施例中以家庭关系识别装置执行家庭关系识别方法为例,说明本技术实施例提供的家庭关系识别装置。下面对家庭关系识别装置进行详细介绍。
[0132]
图7是本技术实施例提供的一种家庭关系识别装置的结构示意图。如图7所示,该家庭关系识别装置700可以包括:确定模块710、划分模块720、获取模块730、拆分模块740、识别模块750。
[0133]
其中,确定模块710,用于在获取到多个用户的指标数据的情况下,根据指标数据和家庭关系对识别模型,确定多个用户中存在家庭关系的多个用户对,其中,每个用户对对应两个用户;划分模块720,用于根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组,其中,每个第一家庭群组中至少包括一个用户对,第一家庭群组对应的用户为第一用户;获取模块730,用于获取每个第一家庭群组对应的第一用户的常驻基站数据;拆分模块740,与根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,得到每个第一家庭群组对应的至少一个第二家庭群组,其中,第二家庭群组对应的用户为第二用户,同一第二家庭群组的所有第二用户对应的居住小区信息相同;获取模块730,还用于获取每个第二家庭群组对应的第二用户的目标数据,目标数据包括个体指标、业务行为数据中的至少一项;识别模块750,用于根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系。
[0134]
本技术实施例的家庭关系识别装置,在获取到多个用户的指标数据的情况下,可以根据指标数据和家庭关系对识别模型,初步确定多个用户中存在家庭关系的多个用户对,并根据社群划分模型对多个用户对进行社群划分,得到多个第一家庭群组。基于此,为了提升家庭用户识别的准确性,获取每个第一家庭群组对应的第一用户的常驻基站数据,并根据第一用户的常驻基站数据对每个第一家庭群组进行拆分,将每个第一家庭群组中居住小区信息相同的第一用户划分至同一家庭群组,得到第二家庭群组。由于第二家庭群组是在第一家庭群组的基础上,依据用户所在居住小区是否一致来划分的,因此能够在第一家庭群组的基础上进一步优化,保证第二家庭群组中的家庭成员能够存在实际家庭关系,
有效提升家庭用户的识别准确性。这样,通过获取每个第二家庭群组对应的第二用户的个体指标、业务行为数据中的至少一项,能够依据每个第二用户的个体指标和/或业务行为数据,对每个第二家庭群组中所有第二用户的家庭关系进行精准识别,提升家庭用户和家庭关系的识别准确度。
[0135]
在本技术的一些实施例中,拆分模块740具体用于:根据每个第一用户的常驻基站数据确定每个第一用户的居住小区信息;将每个第一家庭群组中居住小区信息相同的第一用户划分至同一第二家庭群组,得到每个第一家庭群组对应的至少一个第二家庭群组。
[0136]
在本技术的一些实施例中,该装置还包括:确定模块710,用于在将每个第一家庭群组中居住小区信息相同的第一用户划分至同一第二家庭群组,得到每个第一家庭群组对应的至少一个第二家庭群组之后,确定至少一个第二家庭群组中的第三家庭群组和第四家庭群组,其中,第三家庭群组中第二用户的数量小于预设数量阈值,第四家庭群组中第二用户的数量大于或等于预设数量阈值;计算模块,用于根据第三家庭群组和第四家庭群组分别对应的居住小区信息,计算第三家庭群组与第四家庭群组对应居住小区之间的距离;合并模块,用于在距离小于预设距离阈值的情况下,合并第三家庭群组与第四家庭群组。
[0137]
在本技术的一些实施例中,确定模块710具体用于:确定所有第一用户中的第五用户,其中,第五用户为已办理宽带业务的用户;根据第五用户的常驻基站数据确定第五用户的夜间常驻基站;获取与夜间常驻基站对应的居住小区信息作为第五用户的居住小区信息。
[0138]
在本技术的一些实施例中,确定模块710具体用于:确定所有第一用户中的第六用户,其中,第六用户为所有第一用户中除第五用户以外的用户;根据第六用户的常驻基站数据,确定第六用户中与第一常驻基站建立过连接关系的第一目标用户,其中,第一常驻基站为第五用户对应的任意夜间常驻基站;获取与第一常驻基站对应的居住小区信息作为第一目标用户的居住小区信息。
[0139]
在本技术的一些实施例中,确定模块710具体用于:确定第六用户中的第二目标用户,其中,第二目标用户为第六用户中除第一目标用户以外的用户;从第二目标用户的常驻基站数据中,获取第二目标用户对应的第二常驻基站的位置信息;获取预设覆盖居民小区的位置信息;根据第二常驻基站和预设覆盖居民小区的位置信息,确定预设覆盖居民小区中与第二常驻基站距离最近的目标居住小区;获取目标居住小区的居住小区信息作为第二目标用户的居住小区信息。
[0140]
在本技术的一些实施例中,个体指标包括年龄数据、性别数据,业务行为数据包括应用程序使用数据,识别模块750包括:绘制单元,用于基于每个第二家庭群组对应的目标数据绘制维度交叉矩阵;确定单元,用于基于维度交叉矩阵确定每个第二家庭群组中所有第二用户的家庭关系,得到每个第二用户的角色信息。
[0141]
在本技术的一些实施例中,指标数据包括以下至少一项:通话时长、通话次数、通话天数、通话周数、通话时长占比、通话次数占比、通话周数占比、交往指数、影响力、亲密度。
[0142]
在本技术的一些实施例中,该装置还包括:确定模块710,还用于在根据指标数据和家庭关系对识别模型,确定存在家庭关系的多个用户对之前,在获取到第一样本用户的业务办理信息和住址信息的情况下,根据业务办理信息和住址信息确定与第一样本用户存
在家庭关系的第二样本用户,得到第一样本用户对;确定模块710,还用于在获取到第三样本用户的通话数据的情况下,根据通话数据确定通话行为特征;确定模块710,还用于根据通话行为特征确定与第三样本用户存在家庭关系的第四样本用户,得到第二样本用户对;获取模块730,还用于获取第一样本用户对和第二样本用户对的指标数据,得到训练数据集;训练模块,用于基于训练数据集对逻辑回归模型进行训练,得到家庭关系对识别模型。
[0143]
在本技术的一些实施例中,第一样本用户为业务办理用户,第二样本用户为与第一样本用户的办理业务关联的用户,第三样本用户为非业务办理用户。
[0144]
在本技术的一些实施例中,该装置还包括:获取模块730,还用于在根据每个第二家庭群组对应的第二用户的目标数据,识别每个第二家庭群组中所有第二用户的家庭关系之后,获取第二家庭群组中每个第二用户的流量使用数据和语音使用数据;确定模块710,还用于根据流量使用数据和语音使用数据,确定第二家庭群组对应的家庭业务饱和度;确定模块710,还用于基于家庭业务饱和度和第二家庭群组中所有第二用户的家庭关系,确定家庭画像。
[0145]
本技术实施例中的家庭关系识别装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,非移动电子设备可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
[0146]
本技术实施例中的家庭关系识别装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0147]
图8是本技术实施例提供的一种电子设备的硬件结构示意图。
[0148]
如图8所示,本实施例中的电子设备800可以包括处理器801以及存储有计算机程序指令的存储器802。
[0149]
具体地,上述处理器801可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0150]
存储器802可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器802可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器802可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器802可在综合网关容灾设备的内部或外部。在特定实施例中,存储器802是非易失性固态存储器。存储器可包括只读存储器(read-only memory,rom),随机存取存储器(random access memory,ram),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本技术实施例的方法所描述
的操作。
[0151]
处理器801通过读取并执行存储器802中存储的计算机程序指令,以实现上述实施例中的任意一种家庭关系识别方法。
[0152]
在一个示例中,电子设备800还可以包括通信接口803和总线810。其中,如图8所示,处理器801、存储器802、通信接口803通过总线810连接并完成相互间的通信。
[0153]
通信接口803,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
[0154]
总线810包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线810可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0155]
本技术实施例提供的电子设备,能够实现图1-图6的方法实施例中电子设备所实现的各个过程,并能实现相同的技术效果,为避免重复,在此不再赘述。
[0156]
结合上述实施例中的家庭关系识别方法,本技术实施例可提供一种家庭关系识别系统,该家庭关系识别系统包括上述实施例中的电子设备。电子设备的具体内容可参见上述实施例中的相关说明,在此不再赘述。
[0157]
另外,结合上述实施例中的家庭关系识别方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种家庭关系识别方法的步骤。
[0158]
结合上述实施例中的家庭关系识别方法,本技术实施例可提供一种计算机程序产品来实现。该(计算机)程序产品被存储在非易失的存储介质中,该程序产品被至少一个处理器执行时实现上述实施例中的任意一种家庭关系识别方法的步骤。
[0159]
需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
[0160]
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(application specific integrated circuit,asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0161]
还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0162]
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
[0163]
以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。