本发明涉及大数据,特别涉及一种购房意向模型构建方法、装置、电子设备及存储介质。
背景技术:
1、目前在地产领域从用户行为中构建购房意愿商机模型并择优推荐购房意愿强的客户给线下案场的体系技术尚未成熟,多以人工设定商机权重表和固定打分逻辑为主,机器打分为辅的双轨并行方法,此方法既考虑人工经验知识,也考虑机器学习的优势,但每种方法权重占比难以量化,实际使用中会更多依赖人工经验。
2、现有的购房意向模型构建主要有两大方法,即人工购房意愿模型和算法模型,房地产行业用户行为分散、决策周期长的特点决定了这两类方法都有应用价值。人工购房意愿模型构建分为三步,第一步会根据用户基础信息和应用程序内浏览和点击行为数据抽离出几类重要特征,这些特征会在销售和产品经理的合作推理下过滤出几个重要的特征并为不同的特征分配权重,从而得到一张特征得分表;第二步根据经验为不同类别的特征分配对应的权重系数,该前提假设是用户购房意向跟用户的基础信息和应用程序内某个项目停留时长、访问频次和关键动作有关;第三步是根据前两步得到的结果建模购房意向商机模型,人工模型通常采用线性模型,即根据第一步得到的分数和系数为在线用户打分并将分数拟合到0-10分范围,10分代表用户购房意愿非常强烈,值得优先推荐给线下案场置业顾问,0分代表用户购房意愿较低,可以作为储备用户;算法商机模型构建过程主要分为两步,第一步整理用户在应用程序内行为数据并将数据结构化,然后调用特征工程方法构建用户画像,为了训练模型还需要定义正负样本,第二步采用机器学习方法对模型训练,一般会预测用户到访概率作为用户购房意愿结果输出。
3、以上两种方案各有利弊,人工购房意愿模型仅需设计出商机模型需要的得分表和权重表即可投入使用成本最低,但得分表和权重表的合理性依赖于设计人员的领域知识,且准确性难以评判,在业务发展初期是较为实用的一种方案,随着业务的逐步发展,用户数据和行为特征越来越丰富,该方案对商机模型的构建就会逐渐捉襟见肘,仅能解决当前问题,不能给将来业务的创新场景提供帮助。算法模型需要持续的成本投入,但有效降低了设计人员对得分表和权重表的影响,并且面对多元数据和创新场景通过模型迭代和更新方法即可解决,而且能适应不同的业务场景,但没有考虑人工先验知识,不能给将来的业务提供更加人性化的结果。
技术实现思路
1、基于此,本技术实施例提供了一种购房意向模型构建方法、装置、电子设备及存储介质,可以通过挖掘由用户产生的线上行为数据和线下到访、签约记录,以基于大数据的监督学习方法、重构和优化用户画像并结合人工经验知识的方法实现高购房意愿商机模型的预测。
2、第一方面,提供了一种购房意向模型构建方法,该方法包括:
3、获取用户行为日志数据,对用户行为日志数据进行清洗,并按业务推送周期生成用户快照数据;其中,按业务推送周期生成用户快照数据包括标识生成用户快照数据的生成日期和用户状态信息;
4、按照周期衰减方式聚合用户快照数据作为当前用户画像;
5、根据预先设置的人工商机模型特征得分表对当前用户画像进行系数调整;
6、将当前用户的到访和签约数据作为目标变量构建二分类模型,将系数调整后的当前用户画像数据作为输入特征训练模型,并将训练完成的模型作为购房意向模型输出购房意愿预测结果。
7、可选地,所述方法还包括:
8、将模型出的的购房意愿预测结果与真实的到访和签约数据进行对比;根据对比结果,调整模型的系数或结构。
9、可选地,将模型出的的购房意愿预测结果与真实的到访和签约数据进行对比,包括:
10、计算模型的性能指标,根据所述性能指标对模型性能进行评估,当评估结果不及预期结果时,调整模型的系数或结构;其中,所述性能指标至少包括精确度、召回率和f1分数。
11、可选地,获取用户行为日志数据,对用户行为日志数据进行清洗,并按业务推送周期生成用户快照数据,包括:
12、在目标小程序或目标应用中获取当前用户的行为日志数据;
13、并对行为日志数据进行数据清洗;其中,所述数据清洗至少包括异常值处理、缺失值填充以及数据标准化;
14、根据业务推送周期对用户行为日志数据进行切片,生成对应的用户快照数据;其中,所述业务推送周期包括每天或每周。
15、可选地,按照周期衰减方式聚合用户快照数据作为当前用户画像,包括:
16、确定衰减因子;其中,所述衰减因子通过人工根据业务需求和数据特点进行设置,具体包括线性衰减或指数衰减;
17、对于用户快照数据,根据衰减因子,对其行为数据进行衰减处理;
18、将所有衰减后的用户快照数据按照时间顺序进行聚合得到当前用户画像;所述当前用户画像用于表征当前用户的特征和行为倾向。
19、可选地,所述当前用户画像包括基本属性和动作属性;所述基本属性至少包括用户性别、注册地址;所述动作属性包括小程序浏览记录、点击行为和关键动作。
20、可选地,根据预先设置的人工商机模型特征得分表对当前用户画像进行系数调整,包括:
21、对当前用户画像中的每个特征与人工商机模型特征得分表中的特征进行匹配;根据匹配的特征,从特征得分表中获取相应的得分;
22、根据获取的得分,对当前用户画像中的每个特征进行系数调整;并根据调整后的系数,更新当前用户画像。
23、第二方面,提供了一种购房意向模型构建装置,该装置包括:
24、数据清洗模块,用于获取用户行为日志数据,对用户行为日志数据进行清洗,并按业务推送周期生成用户快照数据;其中,按业务推送周期生成用户快照数据包括标识生成用户快照数据的生成日期和用户状态信息;
25、用户画像模块,用于按照周期衰减方式聚合用户快照数据作为当前用户画像;
26、系数调整模块,用于根据预先设置的人工商机模型特征得分表对当前用户画像进行系数调整;
27、模型预测模块,用于将当前用户的到访和签约数据作为目标变量构建二分类模型,将系数调整后的当前用户画像数据作为输入特征训练模型,并将训练完成的模型作为购房意向模型输出购房意愿预测结果;
28、模型调整模块,用于将模型出的的购房意愿预测结果与真实的到访和签约数据进行对比;根据对比结果,调整模型的系数或结构。
29、第三方面,提供了一种电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面任一所述的购房意向模型构建方法。
30、第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任一所述的购房意向模型构建方法。
31、本技术实施例提供的技术方案带来的有益效果至少包括:
32、(1)通过大数据的监督学习方法,融合设计人员经验知识以改进购房意向模型效果。
33、(2)通过对用户历史行为进行时间上的加权衰减,对用户画像进行近实时的更新,有助于对最近活跃更多的用户更大的关注和用户跟进。
34、(3)融合置业顾问的一些先验知识经验(人工商机模型),对特征工程的开发和模型的参数调优有利。