消息的推送方法、装置、设备、介质及程序产品与流程

文档序号:27830977发布日期:2021-12-07 22:15阅读:108来源:国知局
消息的推送方法、装置、设备、介质及程序产品与流程

1.本技术涉及数据处理技术领域,尤其涉及一种消息的推送方法、装置、设备、介质及程序产品。


背景技术:

2.随着移动互联网技术的飞速发展,用户可以通过手机应用程序娱乐、办公、购物等等。为了提醒用户使用应用程序,从而保持用户粘度,提高用户存活率,应用程序通常会向用户推送消息。
3.在现有技术中,应用程序向用户进行消息推送,主要通过运营人员利用应用程序后台或者第三方工具批量定时的对所有用户进行消息推送。用户可以通过手机通知和状态栏看到消息通知,点击消息通知从而打开该应用程序。
4.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:由于应用程序会对所有用户进行消息推送,使得部分用户会接收到自身不需要的推送消息,推送的精准程度较低。


技术实现要素:

5.本技术提供一种消息的推送方法、装置、设备、介质及程序产品,以解决由于应用程序会对所有用户进行消息推送,使得部分用户会接收到自身不需要的推送消息,推送的精准程度较低的问题。
6.第一方面,本技术实施例提供一种消息的推送方法,包括:
7.获取多个用户的样本信息,每个用户的样本信息中包括所述用户的至少一个特征;
8.基于所述多个用户的样本信息,肘部法则以及kmeans算法将所述多个用户进行聚类处理,得到聚类结果,所述聚类结果包括至少两个用户群体以及每个群体对应的特征信息;
9.根据所述聚类结果中的每个用户群体,生成与所述用户群体的特征信息对应的推送信息,并向所述用户群体中的用户发送所述推送信息。
10.在第一方面的一种可能设计中,每个用户群体的特征信息包括以下至少一种:性别信息,年龄信息,身高,体重,疾病信息,治疗方案,所述根据所述聚类结果中的每个用户群体,生成与所述用户群体的特征信息对应的推送信息,包括:
11.针对所述聚类结果中的每个用户群体,接收用户根据所述用户群体的性别信息,年龄信息,身高,体重,疾病信息,治疗方案中的至少一种输入的信息,生成所述推送信息。
12.在第一方面的另一种可能设计中,所述基于所述多个用户的样本信息,肘部法则以及kmeans算法将所述多个用户进行聚类处理,得到聚类结果,包括:
13.根据所述多个用户的样本信息,基于肘部法则,确定出所述多个用户可被聚类的群体个数;
14.根据所述群体个数以及所述多个用户的样本信息,基于kmeans算法进行聚类处理,得到所述聚类结果。
15.可选的,所述根据所述多个用户的样本信息,基于肘部法则,确定出所述多个用户可被聚类的群体个数,包括:
16.基于肘部法则,根据公式(1):绘制误差平方和变化曲线,其中,sse为误差平方和,k为所述群体个数,dist为欧氏距离,x为所述多个用户的样本信息,c
i
为x与任意选取的第i个用户的样本信息的误差平方最小的距离,i为小于k的正整数;
17.根据所述误差平方和变化曲线,获取所述误差平方和变化曲线的曲率,将所述曲率最大处对应的k值作为所述群体个数。
18.可选的,所述根据所述群体个数以及所述多个用户的样本信息,基于kmeans算法进行聚类处理,包括:
19.根据所述群体个数,获取聚类中心点,所述聚类中心点为随机选取的用户,且所述聚类中心点的个数与所述群体个数相同;
20.根据公式(2):c
i
:=arg min
j
||x
(i)

μ
j
||2,对所述多个用户进行聚类处理,arg为标记符号,用于标记每个用户对应的用户群体,所述μ
j
为第j个聚类中心点,其中j为小于k的正整数。
21.在第一方面的再一种可能设计中,所述获取多个用户的样本信息,包括:
22.对系统数据库中存储的每个用户的信息,进行脱敏处理,得到每个用户的脱敏信息;
23.将每个用户的脱敏信息中的特征进行数值转换,得到所述多个用户的样本信息,每个用户的样本信息中包括所述用户的至少一个采用数值表示的特征。
24.第二方面,本技术实施例提供一种消息的推送装置,包括:
25.获取模块,用于获取多个用户的样本信息,每个用户的样本信息中包括所述用户的至少一个特征;
26.处理模块,用于基于所述多个用户的样本信息,肘部法则以及kmeans算法将所述多个用户进行聚类处理,得到聚类结果,所述聚类结果包括至少两个用户群体以及每个群体对应的特征信息;
27.发送模块,用于根据所述聚类结果中的每个用户群体,生成与所述用户群体的特征信息对应的推送信息,并向所述用户群体中的用户发送所述推送信息。
28.在第二方面的一种可能设计中,每个用户群体的特征信息包括以下至少一种:性别信息,年龄信息,身高,体重,疾病信息,治疗方案,所述发送模块,具体用于:
29.针对所述聚类结果中的每个用户群体,接收用户根据所述用户群体的性别信息,年龄信息,身高,体重,疾病信息,治疗方案中的至少一种输入的信息,生成所述推送信息。
30.在第二方面的另一种可能设计中,所述处理模块,具体用于:
31.根据所述多个用户的样本信息,基于肘部法则,确定出所述多个用户可被聚类的群体个数;
32.根据所述群体个数以及所述多个用户的样本信息,基于kmeans算法进行聚类处理,得到所述聚类结果。
33.可选的,所述处理模块,具体用于:
34.基于肘部法则,根据公式(1):绘制误差平方和变化曲线,其中,sse为误差平方和,k为所述群体个数,dist为欧氏距离,x为所述多个用户的样本信息,c
i
为x与任意选取的第i个用户的样本信息的误差平方最小的距离,i为小于k的正整数;
35.根据所述误差平方和变化曲线,获取所述误差平方和变化曲线的曲率,将所述曲率最大处的k值作为所述用户群体个数。
36.可选的,所述处理模块,具体用于:
37.根据所述群体个数,获取聚类中心点,所述聚类中心点为随机选取的用户,且所述聚类中心点的个数与所述群体个数相同;
38.根据公式(2):c
i
:=arg min
j
||x
(i)

μ
j
||2,对所述多个用户进行聚类处理,arg为标记符号,用于标记每个用户对应的用户群体,所述μ
j
为第j个聚类中心点,其中j为小于k的正整数。
39.在第二方面的再一种可能设计中,所述获取模块,具体用于:
40.对系统数据库中存储的每个用户的信息,进行脱敏处理,得到每个用户的脱敏信息;
41.将每个用户的脱敏信息中的特征进行数值转换,得到所述多个用户的样本信息,每个用户的样本信息中包括所述用户的至少一个采用数值表示的特征。
42.第三方面,本技术实施例提供一种电子设备,包括:处理器、存储器、通信接口及存储在所述存储器上并可在处理器上运行的计算机程序指令,所述处理器执行所述计算机程序指令时用于实现第一方面以及各可能设计提供的方法。
43.第四方面,本技术实施例可提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面以及各可能设计提供的方法。
44.第五方面,本技术实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时用于实现第一方面以及各可能设计提供的方法。
45.本技术实施例提供消息的推送方法、装置、设备、介质及程序产品,在消息的推送方法中,通过获取多个用户的样本信息,每个用户的样本信息中包括用户的至少一个特征。之后基于多个用户的样本信息,肘部法则以及kmeans算法将多个用户进行聚类处理,得到聚类结果,聚类结果包括至少两个用户群体以及每个群体对应的特征信息。最后,根据聚类结果中的每个用户群体,生成与用户群体的特征信息对应的推送信息,并向用户群体中的用户发送推送信息。该方法中,通过对多个用户进行聚类处理,获取至少两个用户群体以及每个群体对应的特征信息,实现根据用户群体的特征信息对每个用户群体中的用户发送推送消息,避免用户接受不需求的推送消息,提高了消息推送的精准程度。
附图说明
46.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
47.图1为本技术实施例提供的消息的推送方法的一种应用场景示意图;
48.图2为本技术实施例提供的消息的推送方法实施例一的流程示意图;
49.图3为本技术实施例提供的误差平方和的折线图;
50.图4为本技术实施例提供的消息的推送方法又一实施例的流程示意图;
51.图5为本技术实施例提供的消息的推送装置的结构示意图;
52.图6为本技术实施例提供的电子设备的结构示意图。
53.通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
54.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
55.在介绍本技术的实施例之前,首先对本技术的背景技术进行解释说明。
56.随着移动互联网技术的飞速发展以及智能手机的普及,人们在沟通、社交、娱乐等活动中越来越依赖于手机应用程序。如,人们可以通过地图应用程序设定出发地以及目的地,从而规划最优化的出行方案;人们也可以通过游戏应用程序与朋友一起进行娱乐互动,放松一天紧张的心情。然而,随着智能手机容量的不断增加,用户安装的应用程序也越来越多,除了一些用于沟通或社交等强需求的应用程序以外,绝大部分应用程序只能被动的存在于智能手机的内存中,等待被用户唤醒。为了提醒用户使用应用程序,从而保持用户粘度,提高用户存活率,应用程序通常会向用户发送推送消息。
57.在现有技术中,应用程序向用户进行消息推送,主要通过运营人员利用应用程序后台或者第三方工具批量定时的对所有用户进行消息推送。通过对用户进行消息推送可以向用户介绍应用程序的新功能以及活动等等,吸引用户点击该应用程序。用户可以通过手机通知和状态栏看到消息通知,点击消息通知从而打开应用程序。
58.然而,由于推送消息是对所有用户进行发送,使得部分用户会接收到自身不需要的推送消息,可能会对用户造成打扰,推送的精准程度较低。用户为了不接受自身不需要的推送消息,可能会关闭该应用程序的消息通知,甚至会卸载该应用程序,导致使用该应用程序的用户流失,用户量下降。
59.针对上述问题,本技术的发明构思如下:在对消息进行推送时,由于没有融入用户行为特征以及内容喜好,且没有结合场景位置以及适当的推送时间,导致部分用户会接收到自身不需要的推送消息。基于此,发明人发现,如果能将用户分为至少两个用户群体,每个用户群体里中的每个用户具有相同的特征信息,结合不同用户群体的特征信息向用户群体中的用户进行消息推送,则可以解决现有技术中推送的精准程度较低的问题,进一步的,为后续提高用户存活率、保持用户粘度奠定基础。
60.示例性的,本技术实施例提供的消息的推送方法可以应用于图1所示的一种应用场景示意图中。图1为本技术实施例提供的消息的推送方法的一种应用场景示意图,用以解决上述技术问题。如图1所示,作为本技术提供的技术方案的执行主体的电子设备可以是电
脑以及其他智能终端等等任一具备数据处理功能的设备,也可以是云端,或者服务器等具有处理功能实体,本技术对此不进行过多限制。
61.由于慢性病病程长且病情迁延不愈,如心脑血管疾病、糖尿病、慢性呼吸系统疾病等,需要进行长期治疗,因此针对用户发送推送消息,如发送最新的药物进展或最适合的治疗方案等信息,能够为用户的治疗提供更多的帮助。
62.在该方案的具体应用中,以用户为糖尿病患者为例进行举例说明。用户在治疗的过程中,医院会获取用户的信息,其中包括性别信息,年龄信息,身高,体重,疾病信息,治疗方案等,之后会将该基本信息和病情信息存储到电子设备、系统数据库、云端或者服务器中。除此以外,智能手机可以通过运行软件获取用户输入的用户的信息。由于电子设备需要根据用户的信息向用户发送推送消息,因此,电子设备需要获取用户的信息。电子设备可以对自身存储的用户的信息进行处理,获取用户的样本信息,或者,电子设备也可以从系统数据库中获取存储的用户的信息并对其进行处理,得到每个用户的样本信息,再或者,电子设备从云端或者服务器中下载每个用户的信息。
63.在下载每个用户的信息的过程中,云端或者服务器可以对每个用户的信息进行处理,将处理获取的每个用户的样本信息发送给电子设备,也可以是电子设备在下载每个用户的信息之后,再对每个用户的信息进行处理,获取每个用户的样本信息。电子设备在获取每个用户的样本信息之后,对用户进行聚类处理,并根据获取的聚类结果向用户的智能手机发送推送消息。
64.下面,通过具体实施例对本技术的技术方案进行详细说明。
65.需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
66.图2为本技术实施例提供的消息的推送方法实施例一的流程示意图。如图2所示,该消息的推送方法可以包括如下步骤:
67.s101:获取多个用户的样本信息。
68.在本技术实施例中,以用户为糖尿病患者为例进行举例说明。为了能针对不同用户的特征发送具有针对性的推送消息,首先需要获取每个用户的样本信息。
69.在本步骤中,电子设备可以从系统数据库中获取存储的每个用户的信息,对每个用户的信息进行处理,获取每个用户的样本信息。
70.其中,每个用户的样本信息中包括用户的至少一个特征,用户的特征可以是性别特征,年龄特征,身高,体重,疾病信息,治疗方案等。以糖尿病用户为例进行举例说明,其中,疾病信息可以为糖尿病型号,糖龄,血糖测量次数以及有无并发症。除此以外,用户的特征还可以包括是否在职,每日血糖测量时间范围,手术史以及地域特征等等,本方案对此不进行具体限制。
71.具体的,由于系统数据库中存储的每个用户的信息中包括如用户姓名、身份证号码、电话、住址等敏感信息,如果不对用户的信息进行脱敏处理,可能会涉及用户的隐私信息,影响用户的信息安全。因此,电子设备获取系统数据库中存储的每个用户的信息后,需要对每个用户的信息进行脱敏处理,得到每个用户的脱敏信息。
72.其中,脱敏处理可以是对敏感信息进行加密处理,也可以是对敏感信息进行替换,如将用户姓名用
“‑”
代替,或者将身份证号码中间12位用“*”代替,还可以将敏感信息进行
截断,舍弃敏感信息来保证每个用户的信息的模糊性,从而保证用户信息的安全性。
73.其中,每个用户的脱敏信息中包含至少一个特征,脱敏信息的部分示例,如表1和表2所示。
74.表1
[0075][0076]
表2
[0077][0078]
其中,a、b、c、d、e均指代具体数值,如1、2、3等。
[0079]
可以理解的是,表1以及表2中仅示出了部分特征名称和该特征名称对应的特征。在实际应用中,还可以包含其他的特征名称和该特征名称对应的特征,可以根据实际需求确定,此处不再赘述。
[0080]
进一步的,将每个用户的脱敏信息中的特征进行数值转换,得到多个用户的样本信息。
[0081]
其中,每个用户的样本信息中包括用户的至少一个采用数值表示的特征。
[0082]
示例性的,电子设备获取每个用户的脱敏信息,对每个用户的脱敏信息中的特征进行数值转换,如获取用户的身高特征为b cm,对该特征进行数值转换,得到转换后的身高特征为b。对于性别特征,分别用2代表男性、用1代表女性,对用户的性别进行数值转换。对于糖尿病类型,分别用1、2、3、4指代1型糖尿病、2型糖尿病、妊娠期糖尿病、其他类型糖尿病,对糖尿病类型进行数值转换,获取转换后的糖尿病类型。
[0083]
示例性的,样本信息的部分示例如表3和表4所示。
[0084]
表3
[0085]
特征名称性别年龄身高体重在职糖尿病类型糖龄特征2/1abc1/01、2、3、4d
[0086]
表4
[0087][0088]
可以理解的是,表3以及表4中仅示出了部分特征名称和该特征名称对应的采用数值表示的特征。在实际应用中,还可以包含其他的特征名称和该特征名称对应的采用数值表示的特征,而且,采用数值表示的特征还可以有其他的表示方式,可以根据实际需求确定,此处不再赘述。
[0089]
s102:基于多个用户的样本信息,肘部法则以及kmeans算法将多个用户进行聚类处理,得到聚类结果。
[0090]
在本步骤中,由于使用应用程序的用户数量较多,如果针对每个用户分别发送推送消息需要耗费大量的时间,效率较低。因此可以对用户进行聚类处理,之后对聚类处理得到的用户群体中的用户统一发送推送消息。
[0091]
具体的,根据多个用户的样本信息,基于肘部法则,确定出多个用户可被聚类的群体个数。
[0092]
其中,肘部法则是以用户的样本信息与质点平方误差作为目标函数,质点为任意选取的用户的样本信息,将用户分为几个用户群体则有几个质点。将每个用户群体的质点与用户群体内的用户的样本信息的误差平方和称为畸变程度,那么,对于一个用户群体,它的畸变程度越低,代表用户群体内的用户越紧密,畸变程度越高,代表用户群体内的用户结构越松散。其中,畸变程度会随着用户的样本信息中特征值数量的增加而降低。
[0093]
具体的,可以根据公式(1):计算每个用户群体的质点与用户群体内的用户的样本信息的误差平方和。其中,sse为误差平方和,k为群体个数,dist为欧氏距离,x为多个用户的样本信息,c
i
为x与任意选取的第i个用户的样本信息的误差平方最小的距离,i为小于k的正整数。
[0094]
其中,在实际计算过程中若发现如手术史、每日血糖测量时间范围等特征有大量缺失时,则这些特征不参与公式(1)运算。
[0095]
其中,根据公式(1)可以得到误差平方和变化曲线,图3为本技术实施例提供的误差平方和变化的折线图。如图3所示,该图的横纵标为群体个数(个),纵坐标为误差平方和,误差平方和随着群体个数的增大而减小,且下降幅度逐渐趋向缓慢。对于有一定区分度的样本信息,在达到某个临界点时误差平方和会得到极大改善,之后缓慢下降,这个临界点就可以考虑为聚类性能较好的点,可以将该点对应的k值作为聚类的群体个数。
[0096]
具体的,根据误差平方和变化曲线,获取误差平方和变化曲线的曲率,将曲率最大处对应的k值作为群体个数。举例来说,计算图3中误差平方和变化曲线中各点处的曲率,得到误差平方和变化曲线中曲率最大的点,获取该点对应的k值,此时k值为4,则将该k值作为聚类的群体个数,也就是说群体个数为4个。
[0097]
进一步的,根据群体个数以及多个用户的样本信息,基于kmeans算法进行聚类处理,得到聚类结果。
[0098]
其中,kmeans算法是一种无监督分类算法。
[0099]
具体的,根据群体个数,获取聚类中心点,聚类中心点为随机选取的用户。
[0100]
可选的,聚类中心点的个数与群体个数相同。
[0101]
示例性的,若用户样本集x中一共有m个用户,其中m个用户的样本信息分别为x
(1)
、x
(2)
、x
(3)
...x
(m)
,即用户样本集为由上述步骤中得到群体个数为k个,由于每个用户群体中都有一个聚类中心,因此共有k个聚类中心。其中,聚类中心是在m个样本信息中随机选取的k个用户,分别为μ1、μ2…
μ
k

[0102]
进一步的,电子设备需要对用户样本集中的用户利用kmeans算法进行聚类处理。
[0103]
其中,根据公式(2):c
i
:=arg min
j
||x
(i)

μ
j
||2,对多个用户进行聚类处理。其中,arg为标记符号,用于标记每个用户对应的用户群体,μ
j
为第j个聚类中心点,其中j为小于k的正整数。
[0104]
具体的,电子设备计算用户样本集中每个用户与每个聚类中心点的误差平方最小的距离并进行对比,获取与该用户距离最近的聚类中心点,则认为该用户属于该聚类中心点,对其进行聚类处理。
[0105]
其中,用户样本集中的用户经过聚类处理后共被聚类为k个用户群体。
[0106]
进一步的,为了能够达到较好的聚类效果,需要重新计算k个用户群体的重组聚类中心点,若重组聚类中心点与聚类中心点为同一个,或者重组聚类中心点与聚类中心点之间的距离小于预设的阈值,或者每个用户群体中的用户与重组聚类中心点的平均误差平方最小的距离和处在预设的范围阈值中,则认为满足聚类条件,得到此时的聚类结果。
[0107]
具体的,可以通过公式(3):计算重组聚类中心点。
[0108]
其中,若重组聚类中心点与聚类中心点之间的距离大于预设的阈值,或者每个用户群体中的用户与重组聚类中心点的平均误差平方最小的距离和不处于预设的范围阈值中,则认为不满足聚类条件,则需要重新通过公式(2)对用户样本集中的用户进行聚类处理,直到满足聚类条件,获取此时的聚类结果。
[0109]
示例性的,为了方便理解,以星团模型为例进行解释说明。为了将所有的星星聚成k个星团,首先随机选取k个星星作为k个星团的聚类中心点,然后对于每一个星星分别计算其到k个质心的距离,选取距离最近的那个聚类中心点,认为该星星属于该聚类中心点,对其进行聚类处理,由此使得每一个星星都有了对应的星团。对于每一个星团,重新计算其重组聚类中心点(对里面所有的星星坐标求平均),若满足聚类条件则认为聚类完成,若不满足聚类条件,则重新进行聚类直至满足聚类条件。
[0110]
其中,聚类结果包括至少两个用户群体以及每个群体对应的特征信息。
[0111]
可选的,每个用户群体的特征信息包括以下至少一种:性别信息,年龄信息,身高,体重,疾病信息,治疗方案。
[0112]
示例性的,聚类结果的部分示例如下所示。
[0113]
clusterid=3,{[1.72
ꢀ‑
75.166
ꢀ‑
2.0
ꢀ‑
1.777
ꢀ‑
28.5
ꢀ‑
3.388
ꢀ‑
55.888
ꢀ‑
173.222
ꢀ‑
3.888
ꢀ‑
2.833
ꢀ‑
1.0]
[0114]
clusterid=0,{[1.55
ꢀ‑
51.0
ꢀ‑
1.571
ꢀ‑
1.642
ꢀ‑
11.142
ꢀ‑
2.928
ꢀ‑
63.785
ꢀ‑
173.714
ꢀ‑
3.071
ꢀ‑
2.0
ꢀ‑
0.714]
[0115]
clusterid=1,{[1.65
ꢀ‑
66.92
ꢀ‑
1.926
ꢀ‑
2.048
ꢀ‑
16.634
ꢀ‑
3.487
ꢀ‑
65.804
ꢀ‑
162.195
ꢀ‑
3.609
ꢀ‑
2.780
ꢀ‑
1.0]
[0116]
clusterid=2,{[1.55
ꢀ‑
57.55
ꢀ‑
1.740
ꢀ‑
2.074
ꢀ‑
13.592
ꢀ‑
3.333
ꢀ‑
60.185
ꢀ‑
173.148
ꢀ‑
2.962
ꢀ‑
2.740
ꢀ‑
0.851]
[0117]
示例性的,可以将聚类结果进行数值转化,数值转化后的聚类结果的部分示例如表5所示。
[0118]
表5
[0119][0120]
可以理解的是,表5中仅示出了部分用户群体和该用户群体对应的特征信息。在实际应用中,还可以包含其他的用户群体和该用户群体对应的特征信息,可以根据实际需求确定,此处不再赘述。
[0121]
s103:根据聚类结果中的每个用户群体,生成与用户群体的特征信息对应的推送信息,并向用户群体中的用户发送推送信息。
[0122]
在本步骤中,电子设备获取到聚类结果后,可以根据每个用户群体的特征信息生成有针对性的推送消息,并向用户群体中的用户进行发送。
[0123]
示例性的,根据表5的聚类结果,可以获取如下结论,
[0124]
(1)用户中男性患者居多,且伴随年龄的增长男性患者数量远大于女性患者;
[0125]
(2)对于糖尿病类型来讲2型糖尿病患者在4类人群中普遍居多;
[0126]
(3)在治疗方案上,随着年龄增长胰岛素治疗方案选择会更多,且基本伴随有并发症;
[0127]
(4)在对未参与计算的地域特征上,由于华中地域用户量占比量太大,会对结果造成干扰,不适宜基于肘部法则计算多个用户可被聚类的群体个数。但是可以通过人工统计得出,华中地区与其他地区相比,患者数量较大的。
[0128]
具体的,针对聚类结果中的每个用户群体,接收用户根据用户群体的性别信息,年龄信息,身高,体重,疾病信息,治疗方案中的至少一种输入的信息,生成推送信息。
[0129]
示例性的,对于用户群体3来说,用户中大多数为男性患者,年龄在66岁左右,体重较重,为65kg左右,且身高较矮,为162cm左右。糖尿病型号为2型糖尿病患者,年龄为13年左右,且用户群体3中的每个用户都有并发症。因此,通过接收用户针对上述信息,可以生成针对性的推送信息,如最新除了一种糖尿病的治疗方案,主要针对于偏胖人群并且有并发症的患者,可以生成该治疗方案的推送消息,并向用户进行发送。
[0130]
其中,在聚类处理过程中,用户的样本信息中的特征能够很大程度上影响聚类结果,因此对于特征的选取尤为重要。例如,用户中糖尿病患者的年龄普遍居中且中老年患者比重很大,若选取年龄特征作为样本信息中的一种,对用户进行聚类的效果较差。
[0131]
可选的,随着用户的样本信息不断完善,对于如工作、地域、手术史等其他重要的特征的加入,对用户进行聚类处理效果会更明显,能够更好的提升向用户发送推送消息的效果。
[0132]
图4为本技术实施例提供的消息的推送方法又一实施例的流程示意图。如图4所示,该消息的推送方法可以包括如下步骤:
[0133]
第1步:开始;
[0134]
第2步:获取每个用户的脱敏信息;
[0135]
第3步:将每个用户的脱敏信息中的特征进行数值转换,得到多个用户的样本信息;
[0136]
第4步:根据多个用户的样本信息,基于肘部法则,确定出多个用户可被聚类的群体个数;
[0137]
第5步:根据群体个数以及述多个用户的样本信息,基于kmeans算法进行聚类处理,重复n次,直到满足聚类条件,得到聚类结果,其中n为大于0的正整数;
[0138]
第6步:对聚类结果中的每个用户群体的特征信息进行分析;
[0139]
第7步:生成与用户群体的特征信息对应的推送信息,向用户群体中的用户发送推送信息;
[0140]
第8步:结束。
[0141]
本技术实施例提供的消息的推送方法,通过获取多个用户的样本信息,每个用户的样本信息中包括用户的至少一个特征。之后基于多个用户的样本信息,肘部法则以及kmeans算法将多个用户进行聚类处理,得到聚类结果,聚类结果包括至少两个用户群体以及每个群体对应的特征信息。最后,根据聚类结果中的每个用户群体,生成与用户群体的特征信息对应的推送信息,并向用户群体中的用户发送推送信息。该方法中,通过对多个用户进行聚类处理,获取至少两个用户群体以及每个群体对应的特征信息,实现根据用户群体的特征信息对每个用户群体发送推送消息,避免用户接受不需求的推送消息,提高了推送的精准程度,为后续提高用户存活率、保持用户粘度奠定基础。
[0142]
下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
[0143]
图5为本技术实施例提供的消息的推送装置的结构示意图。如图5所示,该消息的推送装置包括:获取模块51、处理模块52以及发送模块53;
[0144]
获取模块51,用于获取多个用户的样本信息,每个用户的样本信息中包括用户的至少一个特征;
[0145]
处理模块52,用于基于多个用户的样本信息,肘部法则以及kmeans算法将多个用户进行聚类处理,得到聚类结果,聚类结果包括至少两个用户群体以及每个群体对应的特征信息;
[0146]
发送模块53,用于根据聚类结果中的每个用户群体,生成与用户群体的特征信息对应的推送信息,并向用户群体中的用户发送推送信息。
[0147]
在本技术实施例一种可能设计中,每个用户群体的特征信息包括以下至少一种:性别信息,年龄信息,身高,体重,疾病信息,治疗方案,发送模块53,具体用于:
[0148]
针对聚类结果中的每个用户群体,接收用户根据用户群体的性别信息,年龄信息,身高,体重,疾病信息,治疗方案中的至少一种输入的信息,生成推送信息。
[0149]
在本技术实施例另一种可能设计中,处理模块52,具体用于:
[0150]
根据多个用户的样本信息,基于肘部法则,确定出多个用户可被聚类的群体个数;
[0151]
根据群体个数以及多个用户的样本信息,基于kmeans算法进行聚类处理,得到聚类结果。
[0152]
可选的,处理模块52,具体用于:
[0153]
基于肘部法则,根据公式(1):绘制误差平方和变化曲线,其中,sse为误差平方和,k为群体个数,dist为欧氏距离,x为多个用户的样本信息,c
i
为x与任意选取的第i个用户的样本信息的误差平方最小的距离,i为小于k的正整数;
[0154]
根据误差平方和变化曲线,获取误差平方和变化曲线的曲率,将曲率最大处的k值作为用户群体个数。
[0155]
可选的,处理模块52,具体用于:
[0156]
根据群体个数,获取聚类中心点,聚类中心点为随机选取的用户,且聚类中心点的个数与群体个数相同;
[0157]
根据公式(2):c
i
:=arg min
j
||x
(i)

μ
j
||2,对多个用户的样本信息进行聚类处理,arg为标记符号,用于标记每个用户对应的用户群体,μ
j
为第j个聚类中心点,其中j为小于k的正整数;
[0158]
在本技术实施例再一种可能设计中,获取模块51,具体用于:
[0159]
对系统数据库中存储的每个用户的信息,进行脱敏处理,得到每个用户的脱敏信息;
[0160]
将每个用户的脱敏信息中的特征进行数值转换,得到多个用户的样本信息,每个用户的样本信息中包括用户的至少一个采用数值表示的特征。
[0161]
本技术实施例提供的消息的推送装置,可用于执行上述实施例中的消息的推送方法,其实现原理和技术效果类似,在此不再赘述。
[0162]
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。此外,这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件
中的硬件的集成逻辑电路或者软件形式的指令完成。
[0163]
图6为本技术实施例提供的电子设备的结构示意图。如图6所示,该电子设备可以包括:处理器61、存储器62、通信接口63及存储在所述存储器62上并可在处理器61上运行的计算机程序指令,所述处理器执行所述计算机程序指令时实现前述任一实施例提供的消息的推送方法。
[0164]
应理解,处理器61可以是中央处理单元(英文:central processing unit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digital signal processor,简称:dsp)、专用集成电路(英文:application specific integrated circuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
[0165]
存储器62可以是单独的存储单元,也可以是集成在处理器中的存储单元。处理器的数量为一个或者多个。
[0166]
通信接口63用于实现电子设备与其他设备之间的通信。
[0167]
可选的,该电子设备的上述各个器件之间可以通过系统总线连接。
[0168]
系统总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。存储器可能包含随机存取存储器(random access memory,ram),也可能还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。
[0169]
实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储器中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储器(存储介质)包括:只读存储器(英文:read

only memory,简称:rom)、ram、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetic tape)、软盘(英文:floppy disk)、光盘(英文:optical disc)及其任意组合。
[0170]
本技术实施例提供的电子设备,可用于执行上述任一方法实施例提供的消息的推送方法,其实现原理和技术效果类似,在此不再赘述。
[0171]
本技术实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行上述消息的推送方法。
[0172]
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0173]
可选的,将可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(application specific integrated circuits,asic)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
[0174]
本技术实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,至少一个处理器可以从该计算机可读存储介质中读取该计算机程序,所述至少一个处理器执行所述计算机程序时可实现上述消息的推送方法。
[0175]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1