跨境大数据智能化分析方法、系统以及存储介质与流程

文档序号:33619685发布日期:2023-03-25 10:53阅读:28来源:国知局
跨境大数据智能化分析方法、系统以及存储介质与流程

1.本发明属于大数据技术领域,尤其涉及一种跨境大数据智能化分析方法、系统以及存储介质。


背景技术:

2.为了实现对于跨境电商平台的数据的挖掘和分析,并在此基础上实现对每个地区的仓储的分配处理,在发明专利cn114548810a《一种基于跨境电商平台的大数据用户挖掘方法》中通过基于用户数据获取每个用户的行为数据集合,根据行为数据集合和每个行为数据的初始热度值计算每个用户对当前商品的初始购买热度;分析当前商品在用户间的相关热度指标以及当前商品与其他商品之间的整体自相关指标;结合初始购买热度、相关热度指标、整体自相关指标和热度衰减值计算每个用户对当前商品的购买热度指标;结合每个用户的所在地区和购买热度指标对每个地方仓储中当前商品进行预分配处理,从而有效降低物流的零散运输成本和物流运输过程中的时间成本,但是却存在以下技术问题:1、在进行购买热度分析时,未考虑商品类型的不同,例如对于衣服、冷饮等季节性商品,若采用每个用户的行为数据集合,由于在不同的季节,特别是换季期间,用户的行为数据集合根本无法准确反应实际的购买热度,从而会导致无法准确得到正确的购买热度,进而导致仓储的分配处理也不可能准确。
3.2、在进行商品热度的评估之前,未考虑根据商品的历史销量、点击次数、加入购物车次数等实现对商品的基础热度的确定,并根据商品的基础热度的不同采用不同的购买热度评估方式,对于基础热度较高或者较低的商品,特别是基础热度较低的商品,均采用上述评估方式,会导致整体的评估效率大大降低。
4.针对上述技术问题,本发明提供了一种跨境大数据智能化分析方法、系统以及存储介质。


技术实现要素:

5.为实现本发明目的,本发明采用如下技术方案:根据本发明的一个方面,提供了一种跨境大数据智能化分析方法、系统以及存储介质。
6.一种跨境大数据智能化分析方法,其特征在于,具体包括:s11基于在指定地区的跨境电商平台的商品的商品类型,判断所述商品类型是否属于季节性商品,若是,则确定所述商品所对应的销售月份,并将商品在上一年度的所述销售月份的每月平均销量、每月平均点击次数、每月平均加入购物车次数作为所述商品的销量数据、点击次数数据、加入购物车次数数据,若否,则将近一月的销量、近一月的点击次数、近一月的加入购物车次数作为所述商品的销量数据、点击次数数据、加入购物车次数数据;s12基于所述商品的销量数据、点击次数数据、加入购物车次数数据,采用基于机
器学习算法的预测模型,得到所述商品的基础热度,判断所述商品的基础热度是否大于第一热度阈值,若是,则进入步骤s15,若否,则进入步骤s14;s14判断是否所述商品的基础热度大于第二热度阈值且所述商品的销量数据大于第一销量阈值,其中第二热度阈值小于第一热度阈值,若是,则进入步骤s15,若否,则依据所述商品的销量数据进行在所述指定地区的存储分配;s15将近一月内浏览所述商品的时间大于第一时间阈值的用户与近一月内将所述商品加入购物车的用户的和作为潜在用户,并基于所述潜在用户的浏览所述商品的时间、将所述商品加入购物车的数量、近一年的消费金额,确定所述潜在用户的购买概率,并基于所述购买概率大于第一概率阈值的潜在用户的数量、所述商品的销量数据、近一周的搜索次数、近一周的浏览次数、近一周的加入购物车数量,采用基于机器学习算法的销量预测模型,确定所述商品的预测销量,并依据所述商品的预测销量进行在指定地区的存储分配。
7.通过首先基于商品类型的筛选,从而将季节性商品筛选出来,避免了原有的没有考虑季节性商品导致的热度评估的准确性较低的技术问题,并基于上一年度的每月平均销量、每月平均点击次数、每月平均加入购物车次数进行输入集的构建,进一步提升了商品的评估的准确性和全面性,也保证了预测数据的真实性。
8.通过第一热度阈值、第二热度阈值、第一销量阈值的设置,从而进一步实现了热度较高且销量较高的商品的筛选,并在此基础上实现了不同商品的存储方式的依据的差异性,进一步提升了整体的评估效率,并且也保证了较好的存储分配,提升了整体的可靠性。
9.通过潜在用户的购买概率的构建,从而实现了对潜在用户的进一步筛选,进而为进一步实现对商品的预测销量的准确评估垫定了基础,不仅仅考虑原有的历史销量数据,同时也与潜在用户的情况挂钩,进一步保证了商品的预测销量判断的准确性。
10.通过进一步结合近一周的数据,从而进一步保证了商品的预测销量的预测的实时性和准确性,防止原有的仅仅采用原有数据导致的评估结果失真的技术问题的出现,也为进一步优化库存,降低零散运输成本奠定了基础。
11.另一方面,本技术实施例中提供一种计算机系统,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能 够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时上述的一种跨境大数据智能化分析方法。
12.另一方面,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种跨境大数据智能化分析方法。
13.其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
14.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
15.通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
16.图1是根据实施例1的一种跨境大数据智能化分析方法的流程图;
图2是根据实施例1的商品的基础热度确定的具体步骤的流程图;图3是根据实施例1的潜在用户的购买概率确定的具体步骤的流程图;图4是根据实施例1的商品的预测销量确定的具体步骤的流程图;图5是实施例3中的一种计算机存储介质的框架图。
具体实施方式
17.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
18.用语“一个”、“一”、“该”、“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等。
19.技术问题概括:为了提升跨境电商平台的时效性,往往会在当地设置有前置仓,通过前置仓的设置,可以极大的提升整体的时效,同时也降低了由于单独物流运输带来的经济成本和时效,但是如何实现对前置仓的商品的数量的确定成为亟待解决的技术问题。
20.在以往的前置仓的商品的数量的确定中,往往没有考虑商品类型的不同,例如对于衣服、冷饮等季节性商品,若采用每个用户的行为数据集合,由于在不同的季节,特别是换季期间,用户的行为数据集合根本无法准确反应实际的购买热度;同时在进行商品热度的评估之前,未考虑根据商品的历史销量、点击次数、加入购物车次数等实现对商品的基础热度的确定,并根据商品的基础热度的不同采用不同的购买热度评估方式,从而会导致整体的评估效率大大降低。
实施例1
21.为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种跨境大数据智能化分析方法,其特征在于,具体包括:s11基于在指定地区的跨境电商平台的商品的商品类型,判断所述商品类型是否属于季节性商品,若是,则确定所述商品所对应的销售月份,并将商品在上一年度的所述销售月份的每月平均销量、每月平均点击次数、每月平均加入购物车次数作为所述商品的销量数据、点击次数数据、加入购物车次数数据,若否,则将近一月的销量、近一月的点击次数、近一月的加入购物车次数作为所述商品的销量数据、点击次数数据、加入购物车次数数据;具体的,所述商品类型包括季节性商品、正常商品,根据所述商品的商品标题得到所述商品的关键词,并根据所述商品的关键词确定所述商品的商品类型。
22.具体的举个例子,若商品的商品标题为中长款秋冬新款修身显瘦连衣裙,则可以通过提前设置好的关键词匹配数据库与商品标题进行匹配,成功匹配得到秋冬款、连衣裙,则所述商品即为季节性商品。
23.具体的,所述销售月份根据所述商品的关键词与关键词数据库的匹配结果进行确
定。
24.具体的举个例子,秋冬款、连衣裙,其匹配结果为销售月份为10月份到2月份,具体的将前一年的10月份到今年2月份之间的五个月的每月平均销量、每月平均点击次数、每月平均加入购物车次数作为所述商品的销量数据、点击次数数据、加入购物车次数数据。
25.具体的,近一月的销量、近一月的点击次数、近一月的加入购物车次数均可以通过商品的后台数据或者日志数据进行读取得到。
26.通过首先基于商品类型的筛选,从而将季节性商品筛选出来,避免了原有的没有考虑季节性商品导致的热度评估的准确性较低的技术问题,并基于上一年度的每月平均销量、每月平均点击次数、每月平均加入购物车次数进行输入集的构建,进一步提升了商品的评估的准确性和全面性,也保证了预测数据的真实性。
27.s12基于所述商品的销量数据、点击次数数据、加入购物车次数数据,采用基于机器学习算法的预测模型,得到所述商品的基础热度,判断所述商品的基础热度是否大于第一热度阈值,若是,则进入步骤s15,若否,则进入步骤s14;具体的举个例子,如图2所示,商品的基础热度确定的具体步骤为:s21基于所述商品的销量数据,并判断所述商品的销量数据是否小于第一销量阈值,若是,则所述商品的基础热度为0,若否,则进入步骤s22;s22基于所述商品的销量数据、点击次数数据、加入购物车次数数据构建评估输入集,并基于所述评估输入集,采用基于gwo-gru算法的预测模型,得到所述商品的基本基础热度;具体的,所述gwo-gru算法的预测模型构建的具体步骤为:第一步:基于商品的销量数据、点击次数数据、加入购物车次数数据进行原始数据获取与预处理,并进行预测模型训练数据集的构建。
28.第二步:设置gwo算法基本参数,如寻优维度、种群规模、迭代次数等,同时设置 gru 待寻优超参数学习率irate、输入层神经元数numfeatures、隐藏层神经元数numhiddenunits的取值范围,并进行种群初始化。
29.第三步:个体适应度值计算,根据适应度计算结果把排名前三的个体依次标记为α、β、δ,其余灰狼标记为ω。
30.第四步:α、β、δ、ω狼群位置更新操作,并计算下一代狼群适应度值。
31.第五步:终止条件判断,当满足终止条件时,停止进化,将最优个体所对应的超参输出为 gru 最优超参组合;否则继续狼群位置迭代更新,直至达到终止条件。
32.第六步:结合寻优结果构建 gwo-gru 算法的预测模型,并用训练数据集训练模型。
33.第七步:将输入集输入到训练好的 gwo-gru算法的预测模型中,输出预测结果。
34.第八步:对 gwo-gru 算法的预测模型进行精度评定。
35.具体的举个例子,所述gru算法的测模型参数设置如表1所示:表1gru 预测模型参数设置参数名称取值参数名称取值求解器adam门激活函数sigmoid梯度衰减率0.9状态激活函数tanh
最大迭代次数100输入层神经元数量待寻优超参数预测总期数50隐藏层神经元数量待寻优超参数预测步长1学习率待寻优超参数具体的举个例子,由于gwo算法的位置更新未考虑目标猎物对鲸鱼位置更新的影响,本发明引入自适应权值参数,自适应权值w定义如下式所示:
36.其中k表示当前迭代次数,kmax表示最大迭代次数,w1为基础权值,迭代次数的平方把线性自适应权值转化为非线性自适应权值,迭代前期k较小时目标猎物模糊不清,非线性自适应权值能够缩小目标猎物对位置更新的影响,提高全局搜索的能力;迭代后期k较大时,目标猎物位置清晰,非线性自适应权值能够加速鲸鱼靠近目标猎物的速度,从而提高算法的寻优精度和速度。
37.通过首先采用基于gwo算法优化的gru算法的预测模型,从而在保证预测精度的基础上,进一步提升了整体的预测精度,保证了整体的预测效率。
38.s23基于所述商品的好评率、退货率、不合格率,采用基于层次分析法的数学模型,得到所述商品的意外损失率;具体的,意外损失率的计算公式为:其中k1、k2、k3为权值,p1、p2、p3分别为商品的好评率、退货率、不合格率。
39.s24基于所述商品的意外损失率对所述基本基础热度进行修正,得到所述商品的基础热度。
40.具体的举个例子,所述商品的基础热度的计算公式为:
41.其中j1为基本基础热度,y为意外损失率,y
limit
为意外损失率的阈值,为常数。
42.通过进一步结合商品的意外损失率对所述基本基础热度进行修正,从而进一步保证了基础热度的构建的准确性,不仅考虑到热度的影响因素,同时也考虑到由于商品的质量导致的热度存在下降的可能,进一步保证了最终的评估的准确性。
43.s14判断是否所述商品的基础热度大于第二热度阈值且所述商品的销量数据大于第一销量阈值,其中第二热度阈值小于第一热度阈值,若是,则进入步骤s15,若否,则依据所述商品的销量数据进行在所述指定地区的存储分配;具体的,所述第一热度阈值根据所述指定地区的跨境电商平台的所有商品的总数量、指定地区的跨境电商平台的所有商品的总销量进行确定,当所述指定地区的跨境电商平台的所有商品的总数量越多,指定地区的跨境电商平台的所有商品的总销量越少,则所述第一热度阈值越大。
44.具体的举个例子,第一热度阈值的取值为0.62。
45.具体的,将所述商品的销量数据作为所述商品在所述指定地区的需求量,并基于所述商品的需求量确定所述指定地区的存储分配的商品的数量。
46.具体的举个例子,若商品的销量数据为1万件,则所述商品在所述指定地区的需求量即为1万件,因此指定地区的存储分配的商品的数量也为1万件。
47.通过第一热度阈值、第二热度阈值、第一销量阈值的设置,从而进一步实现了热度较高且销量较高的商品的筛选,并在此基础上实现了不同商品的存储方式的依据的差异性,进一步提升了整体的评估效率,并且也保证了较好的存储分配,提升了整体的可靠性。
48.s15将近一月内浏览所述商品的时间大于第一时间阈值的用户与近一月内将所述商品加入购物车的用户的和作为潜在用户,并基于所述潜在用户的浏览所述商品的时间、将所述商品加入购物车的数量、近一年的消费金额,确定所述潜在用户的购买概率,并基于所述购买概率大于第一概率阈值的潜在用户的数量、所述商品的销量数据、近一周的搜索次数、近一周的浏览次数、近一周的加入购物车数量,采用基于机器学习算法的销量预测模型,确定所述商品的预测销量,并依据所述商品的预测销量进行在指定地区的存储分配。
49.具体的,如图3所示,潜在用户的购买概率确定的具体步骤为:s31基于所述潜在用户的注册时间,判断所述潜在用户的注册时间是否大于一年,若是,则进入步骤s32,若否,则进入步骤s33;具体的举个例子,潜在用户的注册时间为13个月,则潜在用户的注册时间大于一年,进入步骤s32。
50.s32基于所述潜在用户的近一年的消费金额是否大于第一金额阈值,若是,则进入步骤s33,若否,则将所述潜在用户的购买概率设置为0;具体的,潜在用户的近一年的消费金额为200元,第一金额阈值为500元,则所述潜在用户的购买概率为0。
51.s33基于所述潜在用户的浏览所述商品的时间、将所述商品加入购物车的数量、近一年的消费金额作为概率输入集,并基于所述概率输入集,采用基于gwo-gru算法的概率评估模型,得到所述潜在用户的购买概率。
52.具体的,概率评估模型的构建过程与上面类似,此处不再赘述。
53.通过对潜在用户的注册时间的筛选,从而进一步实现了从消费金额对潜在用户的筛选,进一步保证了购买概率判断的效率,提升了判断的全面性。
54.具体的,所述第一概率阈值根据所述商品的价格、商品的历史销量进行确定,其中所述商品的价格越高,商品的历史销量越少,则所述第一概率阈值越大。
55.具体的,如图4所示,商品的预测销量确定的具体步骤为:s41基于所述商品的近一周的搜索次数、近一周的浏览次数、近一周的加入购物车数量,采用基于层次分析法的数学模型,确定所述商品的实时热度;具体的,还可以采用基于神经网络的预测模型的方式实现对实时热度的确认。
56.具体的,商品的实时热度的取值范围在0到1之间,其中商品的实时热度越大,则商品的实时热度越高。
57.具体的举个例子,还可以根据商品的实时热度和基础热度相结合的方式实现对商品的真实热度的构建,并根据商品的真实热度进行销量的预测。
58.具体的,若商品的实时热度为0.7,基础热度为0.6,则商品的真实热度为0.6+0.7/10=0.67。
59.s42基于所述商品的实时热度、所述购买概率大于第一概率阈值的潜在用户的数
量、所述商品的销量数据,采用基于gru算法的销量预测模型,得到预测结果;具体的,还可以将用户的实时热度更换为商品的真实热度,从而进一步提升了最终预测的准确性。
60.s43基于所述预测结果确定所述商品的预测销量。
61.通过进一步结合潜在用户的实时热度,从而进一步提升了最终的预测销量的准确性,并为进一步降低不必要的多次的运费等耗费奠定了基础。
62.通过潜在用户的购买概率的构建,从而实现了对潜在用户的进一步筛选,进而为进一步实现对商品的预测销量的准确评估垫定了基础,不仅仅考虑原有的历史销量数据,同时也与潜在用户的情况挂钩,进一步保证了商品的预测销量判断的准确性。
63.通过进一步结合近一周的数据,从而进一步保证了商品的预测销量的预测的实时性和准确性,防止原有的仅仅采用原有数据导致的评估结果失真的技术问题的出现,也为进一步优化库存,降低零散运输成本奠定了基础。
64.实施例2一种计算机系统,包括:通信连接的存储器和处理器,以及存储在所述存储器上并能 够在所述处理器上运行的计算机程序,其特征在于:所述处理器运行所述计算机程序时上述的一种跨境大数据智能化分析方法。
65.实施例3如图5所示,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种跨境大数据智能化分析方法。
66.在本技术所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
67.另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
68.功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
69.以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完
全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1