一种基于时空聚类的在线广告投放区域热点挖掘算法的制作方法

文档序号:23710135发布日期:2021-01-23 17:10阅读:83来源:国知局
一种基于时空聚类的在线广告投放区域热点挖掘算法的制作方法

[0001]
本发明涉及智能推荐术领域,具体为一种基于时空聚类的在线广告投放区域热点挖掘算法。


背景技术:

[0002]
广告定向投放是目前各行业非常重要的获客手段,目前很多企业都有线下网点,线下网点的服务方位是有地域限制的,使用时空聚类的算法,针对线下服务网点挖掘有效的广告投放区域,可以提升广告投放的有效性和广告投放转化率,降低ocpm以及降低企业营销成本,对企业经营具有非常重要意义;
[0003]
随着智能手机的不断普及,人类的历史移动数据以gps定位、签到位置信息及交通卡等形式得以持久化保存,从而可以形成时空信息数据,时空信息通过不断成熟的数据挖掘技术,如聚类、关联规则挖掘、分类等处理得到一些有价值的信息并应用于广告投放区域定向;
[0004]
目前企业在做广告营销投放时基本采用粗犷的基于区一级的投放,如何降低获客成本,通过精准投放来提升营销的效率是企业面临的一个难题。


技术实现要素:

[0005]
本发明提供一种基于时空聚类的在线广告投放区域热点挖掘算法,可以有效解决上述背景技术中提出企业在做广告营销投放时基本采用粗犷的基于区一级的投放,如何降低获客成本,通过精准投放来提升营销的效率是企业面临的一个难题的问题。
[0006]
为实现上述目的,本发明提供如下技术方案:一种基于时空聚类的在线广告投放区域热点挖掘算法,包括如下步骤:首先收集客户网点,基于空间信息规划出网点服务可达域,其次基于时空信息聚类,获得潜在客户的分布密度,最后基于服务可达域与潜在客户密度挖掘出最有效的广告精准投放区域。
[0007]
根据上述技术方案,所述网点服务可达域使用基于互联网地图服务,结合人口网格数据计算了在多模式交通网络条件下网点可达域计算模式,利用gis图论实现了可达域的精准分析。
[0008]
根据上述技术方案,所述精准分析采用基于将gis与聚类算法相结合的时空聚类算法,它能为聚类算法提供必要的空间数据管理和空间分析的技术支持,使得时空聚类更加符合实际情况。
[0009]
根据上述技术方案,所述时空聚类算法采用遗传算法来作为时空聚类算法,遗传算法具有较强的的鲁棒性,并具有收敛到全局最优的能力,对目标函数既不要求连续,也不要求可微,其中样本划分方法,在待聚类样本集合中,随机选择与聚类数目相同个数的样本点作为聚类中心点,其余待聚类样本点根据距各个聚类中心点的可达距离,划分给最近的中心点。
[0010]
根据上述技术方案,所述时空聚类算法采用遗传算法来作为时空聚类算法,其中
目标函数选择,所有空间样本点到其聚类中心点的可达成本总和的最小化可以作为空间聚类的目标函数。
[0011]
根据上述技术方案,基于服务可达域与潜在客户密度挖掘出最有效的广告精准投放区域,利用gis引擎,将聚类中心点与网点可达域进行gis拓扑推理计算。
[0012]
根据上述技术方案,所述gis拓扑推理计算的流程如下:
[0013]
对于几何对象a和b,首先对两个对象进行拓扑地图模型的转换,实现两个目的:
[0014]
一是通过模型转换达到将外部格式数据转换成拓扑地图模型识别的格式;
[0015]
二是在a和b相交、重复、邻近的位置处生成结点;
[0016]
该结点的作用是将与结点相邻的多条边之间建立关联关系,利用该关联关系进行几何计算,得到空间几何运算图表达的结果,最后根据计算结果进行几何重构,完成空间几何运算。
[0017]
根据上述技术方案,所述生成且在客户投放区域,根据拓扑推理计算的结果选择聚类中心点在可达域内部,并且距离质心最近的点作为潜在客户投放中心点,并且根据拓扑推理计算的结果,将聚类的面与可达域的相交面作为潜在客户投放区域。
[0018]
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,集成可达域图论算法、遗传算法、拓扑推理算法,综合这些算法可以得到最优的潜在客户投放区域,整体算法经过代码优化,得到较好的计算性能。
附图说明
[0019]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0020]
图1是本发明的挖掘算法步骤示意图;
[0021]
图2是本发明的系统挖掘示意图;
[0022]
图3是本发明的可掉头十字路口可达性分析示意图;
[0023]
图4是本发明的十字路口图论模型图;
[0024]
图5是本发明的空间几何运算流程结构示意图。
具体实施方式
[0025]
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0026]
实施例:如图1-2所示,本发明提供技术方案,一种基于时空聚类的在线广告投放区域热点挖掘算法,包括如下步骤:首先收集客户网点,基于空间信息规划出网点服务可达域,其次基于时空信息聚类,获得潜在客户的分布密度,最后基于服务可达域与潜在客户密度挖掘出最有效的广告精准投放区域。
[0027]
如图3-4所示,根据上述技术方案,网点可达域分析基于互联网地图服务,结合人口网格数据计算了在多模式交通网络条件下网点可达域,可达域分析不是在笛卡尔坐标系中计算,而是要基于实际路网来完成,这增加了可达域分析的难度,因为要考虑实际路网情况,所以构造o-d距离矩阵需要将实际路网转化为距离矩阵。
[0028]
s1、首先将整个实际路网中所包含的所有路口(十字路口、丁字路口和其他路口)
从中分离出来,然后对各个单一的路口进行分析处理;
[0029]
s2、对于十字路口将其所包含的四个路口分为a、b、c、d,对于丁字路口将其所包含的三个路口分为a、b、c,对各个路口进行可达性分析,若是双向行驶不可跨越的道路,则由单个十字路口可引出12条弧的有向图;由单个丁字路口可引出6条弧的有向图,若是双向行驶可跨越的道路,则由单个十字路口可引出16条弧的有向图;由单个丁字路口可引出9条弧的有向图,其他路口的可达性分析与上述两种路口完全相同;
[0030]
s3、将实际路网中的所有路口都基于可达性分析完毕后,将所有相邻的路口用公路连接,将所有路口分解出有向图连接起来,所得到的就是实际路网转化为图论中的网络示意图;
[0031]
s4、将已构建的公路配送网络图转化为距离矩阵.利用dijkstra 算法求解任意两点的最短路径。
[0032]
以可掉头十字路口可达性分析举例,基于可达性分析,将各个顶点用有向弧链接起来的到网络图,各个顶点之间都为有向弧。
[0033]
根据上述技术方案,精准分析采用基于将gis与聚类算法相结合的时空聚类算法,它能为聚类算法提供必要的空间数据管理和空间分析的技术支持,使得时空聚类更加符合实际情况;
[0034]
如图5所示,本发明采用基于将gis与聚类算法相结合的时空聚类算法,它能为聚类算法提供必要的空间数据管理和空间分析的技术支持,使得时空聚类更加符合实际情况,基于gis空间技术的空间聚类可以归纳为一个基于目标函数的优化问题,本发明采用遗传算法来作为时空聚类算法,遗传算法具有较强的的鲁棒性,并具有收敛到全局最优的能力,对目标函数既不要求连续,也不要求可微,因而,使用遗传算法解决空间聚类问题具有明显的优势
[0035]
1、样本划分方法:在待聚类样本集合中,随机选择与聚类数目相同个数的样本点作为聚类中心点,其余待聚类样本点根据距各个聚类中心点的可达距离,划分给最近的中心点,样本划分方法按以下方式进行:
[0036][0037]
式中表示样本x
k
与聚类中心点p
i
之间的可达距离,
[0038]
2、目标函数:目标函数对应于遗传算法中的适应度函数,所有空间样本点到其聚类中心点的可达成本总和的最小化可以作为空间聚类的目标函数,如下:
[0039][0040]
3、染色体编码:基于遗传算法聚类的关键是如何将聚类问题的解编码到基因串中,直接对聚类中心点进行编码,采用自然编码方案,则染色体编码为:
[0041][0042]
其中表示聚类中心点p
i
(i=1,2,

,c)取自样本集中
第个样本。
[0043]
基于以上基于gis的时空聚类算法步骤如下:
[0044]
step1.设置ga相关参数,包括最大迭代次数、群体大小、交叉概率、变异概率;
[0045]
step2.群体初始化,按照染色体编码方案对染色体群体进行初始化;
[0046]
step3.群体评价,对染色体进行解码,获得聚类中心点p
i
,基于可达距离对样本集进行划分,采用空间样本点的可达成本总和对染色体群体进行评价;
[0047]
step4.染色体选择,依据评价结果,选择较优的染色体,进行下一步操作;
[0048]
step5.染色体交叉;
[0049]
step6.染色体变异;
[0050]
step7.染色体保留;
[0051]
step8.中止条件检验,如果小于最大迭代次数,则转向step3,否则停止迭代,输出空间样本划分矩阵u和聚类中心点集p。
[0052]
根据上述技术方案,时空聚类算法采用遗传算法来作为时空聚类算法,遗传算法具有较强的的鲁棒性,并具有收敛到全局最优的能力,对目标函数既不要求连续,也不要求可微,其中样本划分方法,在待聚类样本集合中,随机选择与聚类数目相同个数的样本点作为聚类中心点,其余待聚类样本点根据距各个聚类中心点的可达距离,划分给最近的中心点。
[0053]
根据上述技术方案,时空聚类算法采用遗传算法来作为时空聚类算法,其中目标函数选择,所有空间样本点到其聚类中心点的可达成本总和的最小化可以作为空间聚类的目标函数。
[0054]
根据上述技术方案,基于服务可达域与潜在客户密度挖掘出最有效的广告精准投放区域,利用gis引擎,将聚类中心点与网点可达域进行gis拓扑推理计算。
[0055]
拓扑关系的经典表述方式有4交模型、9交模型等,其中9交模型中规定任意一个集合x均由其边界内部(x
0
)以及外部(x-) 构成,对于x中的点集a和b,他们之间的关系可由他们的边界、内部和外部之间的关系来确定,可以由以下的九元组来表示:
[0056][0057]
空间几何运算的流程如图所示,对于几何对象a和b,首先对两个对象进行拓扑地图模型的转换,实现两个目的,一是通过模型转换达到将外部格式数据转换成拓扑地图模型识别的格式;二是在a和b 相交、重复、邻近的位置处生成结点,该结点的作用是将与结点相邻的多条边之间建立关联关系,利用该关联关系进行几何计算,得到空间几何运算图表达的结果,最后根据计算结果进行几何重构,完成空间几何运算。
[0058]
根据拓扑推理计算的结果选择聚类中心点在可达域内部,并且距离质心最近的点作为潜在客户投放中心点,并且根据拓扑推理计算的结果,将聚类的面与可达域的相交面作为潜在客户投放区域。
[0059]
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,集成可达域图论算法、遗传算法、拓扑推理算法,综合这些算法可以得到最优的潜在客户投放区
域,整体算法经过代码优化,得到较好的计算性能。
[0060]
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1