基于大数据的用户画像描绘方法与流程

文档序号:34729961发布日期:2023-07-07 23:36阅读:58来源:国知局
基于大数据的用户画像描绘方法与流程

本发明涉及用户画像描绘,具体为基于大数据的用户画像描绘方法。


背景技术:

1、用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。

2、而现有的用户画像描绘方法,在对用户画像进行描绘刻画的时候,通常收集用户的各项行为信息,然后再对收集到的用户各项行为信息进行分析处理,并将分析处理后的结果整合成若干标签数据,然后利用这些标签数据来对用户画像进行描绘刻画。仅通过收集用户行为特征信息来描绘用户画像,而一些用户的行为特征信息并不具备代表性,这样描绘刻画出来的用户画像不够准确,无法精准的描绘刻画出用户的画像。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本发明提供了基于大数据的用户画像描绘方法,解决了现有的用户画像描绘方法无法及准确精准的描绘出用户画像的问题。

3、(二)技术方案

4、为实现上述目的,本发明提供如下技术方案:基于大数据的用户画像描绘方法,包括以下步骤:

5、s1、采集用户的基本身份信息,并将用户的基本身份信息进行存储;

6、s2、根据用户的基本身份信息,从线上关联匹配到用户的行为特征数据,并对关联匹配到的用户行为特征数据进行分析,分析得出用户行为特征数据的若干个特征数据属性结果,并将其作为第一属性结果;

7、s3、再根据用户的基本身份信息,从线上关联匹配到用户的档案信息和案件信息;

8、s4、将关联匹配到的用户档案信息和案件信息分为不同的文档,再利用tf-idf算法配合textrank算法对其中的关键词进行提取,先利用tf-idf算法提取出每个文档中的主题,再将提出出来的主题交由textrank算法,并对其中的关键词进行提取,从而能够得到更加精确的关键词信息;

9、s5、将提取出来的关键词进行属性分析,并得到不同的属性结果,将其作为第二属性结果;

10、s6、利用回归算法分别对若干第一属性结果和若干第二属性结果进行处理,并得到若干第一属性结果和若干第二属性结果的最优参数;

11、s7、将得到的用户行为特征数据关联到若干最优的第一属性结果下,同时将从用户档案信息和案件信息中提取出来的关键词关联到若干最优的第二属性结果下;

12、s8、再将若干最优的第一属性结果和若干最优的第二属性结果进行合并化处理,同时将其下对应的用户行为特征数据和关键词进行合并化处理,再通过数据计算分析后,得到最终的属性结果以及其对应的最终特征数据,并将最终的属性结果和特征数据作为用户标签用于精确的刻画出用户画像。

13、优选的,所述s1中,采集的用户基本身份信息包括用户手机号、姓名、身份证号码等可以证明其身份的基本信息。包括但不局限于上述例举出来的用户基本身份信息。

14、优选的,所述s2中,将从线上关联匹配到的用户行为特征属性进行存储,并在达到预设定的时间后,会再次从线上关联匹配用户的行为特征数据,并将其与之前存储的用户行为特征数据进行对比,若再次关联匹配到的用户行为特征数据与之前存储的用户行为特征数据相同,则摒弃;反之,则对再次关联匹配到的用户行为特征数据进行存储,同时进入后续操作。

15、对再次关联匹配到的用户行为特征数据进行存储的时候,将再次关联匹配到的与之前存储的用户行为特征数据相同的数据舍弃,将不同的数据进行存储。

16、优选的,所述s3中,将从线上关联匹配到的用户档案信息和案件信息进行存储,并会在到达预设定的时间后,再次从线上获取用户档案信息和案件信息,并提取出再次获取的用户档案信息和案件信息的存档时间,然后与之前存储的档案信息和案件信息的存档时间对比,若再次获取的档案信息和案件信息的存档时间距当次获取操作的时间近,则对再次获取用户的档案信息和案件信息进行存储,同时进入后续操作。

17、对再次获取用户的档案信息和案件信息进行存储的时候,若再次获取用户的档案信息和案件信息的存档时间与之前存储的用户的档案信息和案件信息的存档时间相同或者相近,则不对再次获取用户的档案信息和案件信息进行存储,同时不仅进入后续操作;反之则存储再次获取用户的档案信息和案件信息,并进入后续操作。

18、优选的,所述s8中,通过下式对若干最优的第一属性结果和若干最优的第二属性结果以及其下对应的用户行为特征数据和关键词进行合并化处理,同时计算分析后,得到最终的属性结果以及其对应的最终特征数据:

19、

20、其中,zab为最终属性结果a及其对应的最终特征数据b;nij为第一属性结果i下的用户行为特征数据j;mkf为第二属性结果k下的关键词数据f。

21、优选的,所述s4中,在从用户档案信息和案件信息对关键词进行提取时,提取到的关键词为修饰用户性格、行为等特征的词语;预先设定好若干合理的关键词,并通过回归算法得到合理关键词的最优参数,并将其作为阈值,将提取到的关键词与阈值进行比对,判断提取到的关键词与阈值的离散程度,若离散程度小,则保留提取到的关键词数据,反之,则摒弃提取到的关键词数据。

22、优选的,所述方法还包括:将最终描绘完成的用户画像上传到服务器中进行存储,存储的过程中,将最终描绘完成的用户画像分割为若干标签信息数据,并将若干标签信息数据分别存储到不同的服务器中,同时会在存储到不同服务器中的若干标签信息数据标记上相应的用户基本信息。

23、优选的,将用户最终画像的若干标签信息数据存储到不同服务器中的具体过程如下:

24、首先获取部署在线上服务器的总数量,并将其定义为数组m,m=[f1,f2,...fn],其中,fn表示每台服务器,n表示为服务器标号;然后通过下式选出用于存储数据的服务器:

25、

26、其中,mlength为数组m的长度,s为1到mlength中任意的正整数;

27、将上述公式运行五次(运行次数可以根据实际的需要进行调整),得到n的五个结果,从而可以从线上选出五台用于存储数据的服务器,然后将用户最终画像的若干标签信息数据存储到五台服务器中;同时将上式运行五次的结果相加得到和数sum,然后通过下式得到密数gy:

28、gy=sum-n

29、将得到的五个密数组合形成密令,再将得到的密令部署到选出的五台服务器上。

30、在需要获取用户画像信息的时候,以和数sum和密数gy作为密钥将密令解锁,即可得到存储用户画像的若干标签信息数据的服务器,然后遍历这些服务器,将若干标签信息数据取出并进行整合,经过计算机的整合后,即可得到用户画像。

31、(三)有益效果

32、本发明提供了基于大数据的用户画像描绘方法,具备以下有益效果:

33、(1)、本发明在对用户画像描绘的时候,收集用户的行为特征数据和用户的档案信息和案件信息中提取出来的关键词数据,然后对用户行为特征数据以及从用户的档案信息和案件信息中提取出来的关键词数据进行最优及最终化处理,从而得到最终且最优的特征数据以及其对应的属性结果,然后利用最终且最优的特征数据以及其对应的属性结果作为标签对用户的画像进行描绘,从而能够得到更加准确且精准的用户画像。

34、(2)、本发明在从用户档案信息和案件信息对关键词进行提取的时候,会将提取出来的关键词数据与预先设定好的阈值进行比对,若提取出来的关键词数据与阈值之间的离散程度较大,则对提取出来的关键词数据进行舍弃,若两者之间的离散程度较小,则保留提取出来的关键词数据,然后利用保留下来的关键词数据进行后续操作,并对用户画像进行描绘,从而使描绘出来的画像更加的准确。

35、(3)、本发明通过将描绘出来的用户画像分割成若干标签信息数据,再将带有用户基本信息的若干标签信息数据分别存储到不同的服务器中,减小单个服务器存储大量的完整的用户画像信息数据的存储压力。同时,会在存储服务器上部署随机生成的密令,再需要提取服务器中的若干标签信息数据的时候,需要通过解锁密令方可正常获取数据,从而得到用户的画像信息,使数据更加的安全,避免用户画像出现泄漏,给用户推送不良信息,从而给用户造成骚扰的情况。

36、(4)、本发明能够定期的获取与用户相关联的档案信息和案件信息以及用户的行为特征数据,然后对再次获取到的用户档案信息和案件信息以及行为特征数据进行处理,从而能够对用户画像进行描绘刻画,进而可以实现对用户画像进行持续的更新,能够始终保证用户画像的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1