一种个人代发业务留存率提升的方法及装置与流程

文档序号:24972188发布日期:2021-05-07 22:43阅读:467来源:国知局
一种个人代发业务留存率提升的方法及装置与流程

本申请涉及大数据分析技术领域,尤其涉及一种个人代发业务留存率提升的方法及装置。



背景技术:

随着市场经济的不断发展,商业银行面临的竞争越来越激烈,并且现在社会经济增速加快,监管的要求不断地提高,我国的商业银行的业务和盈利空间在数轮降息的大背景之下已经被逐步地压缩,民营银行的政策逐步地放开与推行,使各大银行之间的竞争逐渐加剧。

目前,各银行在对代发客户进行营销时,一方面存在客户基数大,难以识别高潜力营销客户,且营销成本大的问题,另一方面,各银行没有有效的匹配产品进行人性化推荐,使得营销效果甚微。



技术实现要素:

本申请实施例通过提供一种个人代发业务留存率提升的方法及装置,解决了现有技术中银行客户流失的问题,进而实现了有选择地面对有价值的客户,去除掉无价值的客户,节省了大量的时间和人力,并且有针对性地对原有的客户进行匹配产品推荐,使得整体的个人代发业务留存率有较大的提升。

第一方面,本发明实施例提供了一种个人代发业务留存率提升的方法,该方法包括:

获取多张分析基础表;

根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;

根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;

对所述聚类分组进行筛选,确定待分析组;

构建分类模型,对所述待分析组进行分类,确定分类结果;

根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。

结合第一方面,在一种可能的实现方式中,所述基础分析表包括:客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。

结合第一方面,在一种可能的实现方式中,所述确定数据宽表后,还包括:删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户。

结合第一方面,在一种可能的实现方式中,所述根据所述数据宽表筛选与留存率关联的重要指标特征,包括:基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。

结合第一方面,在一种可能的实现方式中,所述聚类分析,包括:根据kmeans方法对代发客户进行聚类分析,确定聚类分组。

结合第一方面,在一种可能的实现方式中,所述构建分类模型,包括:运用混淆矩阵和roc曲线对模型效果进行检验,确定效果最好的所述分类模型。

第二方面,本发明实施例还提供了一种个人代发业务留存率提升的装置,包括:

数据获取单元:用于获取多张分析基础表;

数据确定单元:用于根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;

数据聚类单元:用于根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;

筛选分组单元:用于对所述聚类分组进行筛选,确定待分析组;

模型分类单元:用于构建分类模型,对所述待分析组进行分类,确定分类结果;

结果确定单元:用于根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。

结合第二方面,在一种可能的实现方式中,所述数据获取单元具体包括获取客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。

结合第二方面,在一种可能的实现方式中,所述数据确定单元还包括,数据处理单元,具体用于删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户。

结合第二方面,在一种可能的实现方式中,所述数据聚类单元还包括特征分析单元,具体用于基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。

结合第二方面,在一种可能的实现方式中,所述筛选分类单元具体用于据kmeans方法对代发客户进行聚类分析,确定聚类分组。

结合第二方面,在一种可能的实现方式中,所述模型分类单元还包括模型测试单元,具体用于运用混淆矩阵和roc曲线对模型效果进行检验,确定效果最好的所述分类模型。

第三方面,本发明实施例还提供了一种个人代发业务留存率提升的设备,其特征在于,包括存储器和处理器;

所述存储器用于存储计算机可执行指令;

所述处理器用于执行所述计算机可执行指令,以实现个人代发业务留存率提升的方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现个人代发业务留存率提升的方法。

本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

本发明实施例通过采用了一种个人代发业务留存率提升的方法,包括获取多张基础分析表,根据业务关系,将多张分析基础表关联,形成数据宽表,这一过程,将零散个人数据进行关联,能够多维度地分析个人数据进行,得到个人数据完整的数据链;通过数据宽表进行筛选重要指标特征,并且结合业务关系进行聚类分析,确定聚类分析,在这一过程,对已经处理好的数据进行分析、分类得到度数据初步的聚类结果;通过这个聚类结果进行筛选出有价值的客户,确定出待分析组,构建细分的分类模型,分类模型可以由随机森林进行训练的,随机森林不容易陷入过拟合,且有很好的抗噪声能力,对数据集的质量要求也不高,并且实现比较简单,在分类模型训练成功之后,运用混淆矩阵,roc曲线,模型精准度等分类评估指标进行模型效果检验,直到选出训练的最好的模型;运用模型输出留存率提升的潜在客户,并针对潜在的客户进行专业的营销,有效解决了银行客户流失的问题,进而实现了有选择地面对有价值的客户,去除掉无价值的客户,节省了大量的时间和人力,并且有针对性地对原有的客户进行产品推荐,使得整体的个人代发业务留存率有较大的提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的个人代发业务留存率提升的方法的步骤流程图;

图2为本申请实施例提供的个人代发业务留存率提升的装置结构示意图;

图3为本申请实施例提供的个人代发业务留存率提升的设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种个人代发业务留存率提升的方法,如图1所示,该方法包括以下步骤:

步骤s101:获取多张分析基础表。

步骤s102:根据业务关系,将多张分析基础表进行指标关联,确定数据宽表。

步骤s103:根据数据宽表筛选与留存率关联的重要指标特征,并结合业务关系进行聚类分析,确定聚类分组。

步骤s104:对聚类分组进行筛选,确定待分析组。

步骤s105:构建分类模型,对待分析组进行分类,确定分类结果。

步骤s105:根据分类结果制定不同的方案,并确定潜在营销代发客户名单。

在本申请中,通过对客户个人的基础表做关联,得出客户个人的关联表信息,并且在对表中的数据进行处理之后,得到与留存率有关的重要指标特征,结合业务关系,对数据进行聚类分析,得到聚类分组为多个组,对聚类结果中的多个组进行筛选得到后续待分析的组,构建分类模型,对待分析的组进行更加细致的分类,后根据不同的分类得到不同的定制方案。并且能够得到营销成功率较高的客户名单。

在步骤s101中,基础分析表包括:客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表,根据上述表中的一个共有的特征,一般选择客户的客户号。

在步骤s102中,确定数据宽表后,还包括:删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户,并且根据客户的客户号对步骤s101中的多张表进行关联,形成一张宽表,一条客户信息应该至少包括年龄、性别、资产余额、交易笔数和产品开通情况等客户的全部信息。在确定好客户的宽表信息后,对宽表信息中的数据进行缺失值填充,一种具体的缺失值填充方法为:对资产以及持有资产等数值性指标进行0值填充,年龄等进行平均值填充,对性别数据进行属性变换,0代表女性,1代表男性,未知值用2代表。进一步的缺失值的处理方法常见的方法如下:人工填写缺失值、使用一个全局常量填充缺失值、使用属性的平均值填充缺失值以及使用同一类的所有样本的平均值进行缺失值填充。

在步骤s103中,根据数据宽表筛选与留存率关联的重要指标特征,包括:基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。

在得到高留存客户与低留存客户之间的特征差异后,结合特征进行聚类分析,包括:根据kmeans方法对代发客户进行聚类分析,确定聚类分组。根据各条数据之间的相似性来进行聚类,聚类分为以下这几个步骤:

(1)首先输入k的值,即我们希望将数据集经过聚类得到k个分组。

(2)从数据集中随机选择k个数据点作为质心,centroid。

(3)对集合中每一个子节点,计算与每一个质心的距离(距离的含义后面会讲),离哪个质心距离近,就跟定哪个质心。

(4)这时每一个质心下都聚集了好多子节点,通过算法选出新的质心。

(5)如果新的质心和旧的质心之间的距离小于某一个设置的阈值(表示重新计算的质心的位置变化不大,趋于稳定,或者说收敛),可以认为我们进行的聚类已经达到期望的结果,算法终止。

(6)如果新的质心和旧的质心距离变化很大,需要迭代(3)~(5)步骤。

k值主要取决于个人的经验与感觉,通常的做法是多尝试几个k值,看分成几类的结果更好解释,更符合分析目的等。或者可以把各种k值算出的sse作比较,取最小的sse的k值。

初始的k个质心通常是随机选,初始质心的选取对最终聚类结果有影响,多执行算法,哪个结果更合理,就用哪个结果。当然也有一些优化的方法,第一种是选择彼此距离最远的点,具体来说就是先选第一个点,然后选离第一个点最远的当第二个点,然后选第三个点,第三个点到第一、第二两点的距离之和最小,以此类推。第二种是先根据其他聚类算法(如层次聚类)得到聚类结果,从结果中每个分类选一个点。质心的距离,第一种计算方法,欧几里德距离,这个距离就是平时我们理解的距离,如果是两个平面上的点,也就是(x1,y1),和(x2,y2),两点距离是:

如果是三维空间中:

推广到高维空间公式就以此类推。可以看出,欧几里德距离真的是数学加减乘除算出来的距离,因此这就是只能用于连续型变量的原因。第二种,余弦相似度,余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。

在得到上述的聚类结果后,使用随机森林算法进行客户的分类,再输出高、中、低等级的客户名单。多次进行聚类,得到多个聚类结果。在上述进行距离计算构建分类模型时,也可以运用混淆矩阵和roc曲线对多个聚类结果进行检验,确定效果最好的分类模型。

虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。本实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或设备执行时,可以按照本实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

本发明实施例还提供了一种个人代发业务留存率提升的装置200,如图2所示,个人代发业务留存率提升的装置200包括:数据获取单元201、数据确定单元202、数据聚类单元203、筛选分组单元204、模型分类单元205以及结果确定单元206。数据获取单元201用于获取多张分析基础表;数据确定单元202用于根据业务关系,将多张分析基础表进行指标关联,确定数据宽表;数据聚类单元203用于根据数据宽表筛选与留存率关联的重要指标特征,并结合业务关系进行聚类分析,确定聚类分组;筛选分组单元204用于对聚类分组进行筛选,确定待分析组;模型分类单元205用于构建分类模型,对待分析组进行分类,确定分类结果;结果确定单元206用于根据分类结果制定不同的方案,并确定潜在营销代发客户名单。

数据获取单元201具体包括获取客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。数据确定单元201还包括,数据处理单元,具体用于删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户以及非代发客户。

数据聚类单元203还包括特征分析单元,具体用于基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。

筛选分类单元204具体用于据kmeans方法对代发客户进行聚类分析,确定聚类分组。

模型分类单元205还包括模型测试单元,具体用于运用混淆矩阵和roc曲线对模型效果进行检验,确定效果最好的分类模型。

上述实施例阐明的装置或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。当然,也可以将实现某功能的单元由多个子单元或子单元组合实现。

本发明实施例还提供了一种个人代发业务留存率提升的设备,如图3所示,包括存储器301和处理器302,存储器301与处理器302之间通过系统总线303连接。存储器301用于存储计算机可执行指令;处理器302用于执行计算机可执行指令,以实现个人代发业务留存率提升的方法。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有可执行指令,计算机执行可执行指令时能够实现个人代发业务留存率提升的方法。

上述存储介质包括但不限于随机存取存储器(英文:randomaccessmemory;简称:ram)、只读存储器(英文:read-onlymemory;简称:rom)、缓存(英文:cache)、硬盘(英文:harddiskdrive;简称:hdd)或者存储卡(英文:memorycard)。所述存储器可以用于存储计算机程序指令。

本申请中所述的方法、装置或单元可以以计算机可读程序代码方式实现控制器按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(英文:applicationspecificintegratedcircuit;简称:asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件单元又可以是硬件部件内的结构。

本申请所述装置中的部分单元可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序单元。一般地,程序单元包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序单元可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施方式采用递进的方式描述,各个实施方式之间相同或相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

以上实施例仅用以说明本申请的技术方案,而非对本申请限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1