1.本技术涉及大数据及电商优化及数据处理技术领域,特别涉及基于大数据电商优化的用户行为数据处理方法及系统。
背景技术:2.随着科学技术的不断发展,大数据的应用领域越来越广泛。以智慧电商为例,在大数据时代下,电商优化技术得到了快速的发展,能够实现用户与电商人员、电商平台间的互联互通和信息共享,促进电商业务协同,实现电商资源的高效配置。
3.现目前,电商优化技术是用于识别到用户行为的一种技术方案。但是,在实际操作过程中,由于每个用户的喜好和兴趣是不同的,从而可能导致电商优化技术不能准确且可靠的识别到用户意图。因此,亟需一种技术方案以改善上述技术问题。
技术实现要素:4.为改善相关技术中存在的上述背景技术存在的技术问题,本技术提供了基于大数据电商优化的用户行为数据处理方法及系统。
5.本技术提供了一种基于大数据电商优化的用户行为数据处理系统,包括用户行为跟踪服务器和云计算服务器,所述用户行为跟踪服务器和所述云计算服务器通信连接;所述用户行为跟踪服务器用于:向所述云计算服务器上传用户行为跟踪数据;所述云计算服务器具体用于:获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
6.进一步地,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每
个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
7.进一步地,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述云计算服务器具体还用于:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态;所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
8.进一步地,所述云计算服务器获取目标用户行为跟踪数据的目标用户行为跟踪标签的步骤,包括:从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签;若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签;若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤,其中,所述云计算服务器具体还用于:提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征;从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度
阈值;若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系;若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
9.进一步地,所述云计算服务器具体还用于:若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列;确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
10.进一步地,所述云计算服务器根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列的步骤,包括:若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
11.进一步地,所述云计算服务器具体还用于:采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新。
12.本技术提供了一种基于大数据电商优化的用户行为数据处理方法,应用于云计算服务器,所述方法包括:获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
13.本技术提供了一种云计算服务器,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与云计算服务器中的非易失性存储器连接;所述处理器在运行时通过
所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述的方法。
14.本技术提供了一种应用于计算机的可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在云计算服务器的内存中运行时实现上述的方法。
15.本技术实施例提供的技术方案中,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
16.当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
17.应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本技术。
附图说明
18.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并于说明书一起用于解释本技术的原理。
19.图1为本技术实施例所提供的基于大数据电商优化的用户行为数据处理系统的架构示意图;图2为本技术实施例所提供的基于大数据电商优化的用户行为数据处理方法的流程图;图3为本技术实施例所提供的基于大数据电商优化的用户行为数据处理装置的功能模块框图。
具体实施方式
20.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
21.为了便于对上述的基于大数据电商优化的用户行为数据处理方法及系统进行阐述,请结合参考图1,提供了本技术实施例所公开的基于大数据电商优化的用户行为数据处理系统100的通信架构示意图。其中,所述基于大数据电商优化的用户行为数据处理系统100可以包括用户行为跟踪服务器200以及云计算服务器300,所述用户行为跟踪服务器200与云计算服务器300连接。
22.在具体的实施方式中,用户行为跟踪服务器200可以用于执行相关的检测项目,然后将采集到的用户行为跟踪数据传输给云计算服务器300,相应的,云计算服务器300可以是平板电脑、台式电脑或笔记本电脑等具有数据处理功能的设备。
23.在上述基础上,请结合参阅图2,为本技术实施例所提供的基于大数据电商优化的用户行为数据处理方法的流程示意图,所述基于大数据电商优化的用户行为数据处理方法可以应用于图1中的云计算服务器300,进一步地,所述基于大数据电商优化的用户行为数据处理方法具体可以包括以下步骤s21-步骤s24所描述的内容。
24.步骤s21,云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔。
25.示例性的,目标用户行为跟踪数据用于表征用户行为跟踪服务器对应的用户行为检测结果,用户行为跟踪服务器可以将目标用户行为跟踪数据上传给云计算服务器。用户行为可以理解的是:用户浏览电商商品等行为。
26.在实际应用时,目标用户行为跟踪数据可以表示为对用户行为进行挖掘或者跟踪。
27.步骤s22,云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
28.进一步地,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔。可以理解的是,关联时长间隔可以根据实际情况进行调整。
29.示例性的,所述候选关联用户行为跟踪数据序列表示针对每个目标用户关注波动时长所匹配的用户行为跟踪数据的集合。此外,候选关联用户行为跟踪数据序列可以为多个。
30.步骤s23,云计算服务器确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列。
31.在本实施例中,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列。
32.相应的,用户关注波动频率可以用于表征用户行为跟踪数据在单位时长内出现突变的累积次数。预设关联阈值可以理解为用户关注波动频率的判断值。
33.步骤s24,云计算服务器根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
34.示例性的,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。在准确确定出关联用户行为跟踪数据序列的前提下,能够实现对目标用户行为跟踪数据的有效误差校验,从而降低目标用户行为跟踪数据的错误率,提高目标用户行为跟踪数据的检测精度。
35.可以理解,在执行上述步骤s21-步骤s24所描述的内容时,本技术实施例提供的技术方案中,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,
确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
36.当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
37.在一种可替换的实施例中,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,存在多个目标用户关注波动时长导致的目标用户关注波动时长紊乱的问题,这样就难以对每个目标用户关注波动时长进行有效地区分,就不能精确地得到至少两个目标用户关注波动时长,为了改善上述技术问题,步骤s21所描述的获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,具体可以包括以下步骤s211和步骤s212所描述的内容。
38.步骤s211,获取目标用户行为跟踪数据的目标用户行为跟踪标签。
39.示例性的,目标用户行为跟踪标签用于表示目标用户行为跟踪数据中的关键内容。进一步地,关键内容可以体现出对应的目标用户行为跟踪数据的特征。比如:在相关数据中进行排序并标号,这样可以通过对应的序号查询到对应的相关数据的位置,以便于得到对应的数据内容,这样的序号可以代指标签。
40.步骤s212,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长。
41.可以理解,在执行上述步骤s211和步骤s212所描述的内容时,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,根据用户行为跟踪数据的用户关注波动时长的映射关系,能准确地对每个目标用户关注波动时长精确的进行区分,确保目标用户关注波动时长的完整性,从而有效地避免每个目标用户关注波动时长之间的相互干扰。譬如,可以通过波形变换技术,将目标用户行为跟踪数据换成每一个时长点对应的突变波形数据。然后,确定突变波形数据中的波动幅度超过预设突变标准对应的时长点,作为用户关注波动开始时长和用户关注波动结束时长,该两个时长点所形成的时长段,则为目标用户行为跟踪数据中的用户关注波动时长段。当然,本领域技术人员可以在上述内容的基础上根据实际需要采用各种方式识别出目标用户行为跟踪数据中的用户关注波动时长段,本技术实施例对此不作限制。
42.在一种可替换的实施例中,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,存在用户关注波动时长不准确的问题,从而难以精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,为了改善上述技术问题,步骤s22所描述的分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤q1所描述的内容。
43.步骤q1,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候
选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
44.举例而言,映射关系包括一对一、多对一或者一对多。
45.可以理解,在执行上述步骤q1所描述的内容时,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,有效地避免用户关注波动时长不准确的问题,从而能精确地确保用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,因此能精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
46.在一种可替换的实施例中,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,存在获取不到准确地目标用户行为跟踪数据的问题,从而难以准确地的得到对应的至少两个目标用户关注波动时长,为了改善上述技术问题,步骤s21所描述的获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,具体可以包括以下步骤w1和步骤w2所描述的内容。
47.步骤w1,获取目标用户行为跟踪数据的目标用户行为跟踪标签。
48.步骤w2,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长。
49.举例而言,用户行为跟踪数据的用户关注波动时长的映射关系中的映射关系表示预先储存的用户行为跟踪标签和用户关注波动时长的一一对应关系。
50.可以理解,在执行上述步骤w1和步骤w2所描述的内容时,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,避免获取不到准确地目标用户行为跟踪数据的问题,从而能够准确地的得到对应的至少两个目标用户关注波动时长。
51.基于上述基础,还可以包括以下步骤e1所描述的内容。
52.步骤e1,根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态。
53.可以理解,在执行上述步骤e1所描述的内容时,通过用户关注波动时长的映射关系,这样能精确地确定出目标用户行为跟踪数据中的每个所述目标用户关注波动时长对应的目标用户关注波动状态,进一步地,提高目标用户行为跟踪数据的准确度,从而确保目标用户行为跟踪数据进行相关处理的精度。
54.在一种可替换的实施例中,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,存在每个目标用户关注波动时长对应的候选用户关注波动时长不能进行区分的问题,从而难以精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,为了改善上述技术问题,步骤q1所描述的分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤t1所
描述的内容。
55.步骤t1,根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
56.示例性的,用户关注波动状态表示可以用于表征用户行为跟踪数据在单位时长内出现突变的状态。
57.可以理解,在执行上述步骤t1所描述的内容时,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,避免每个目标用户关注波动时长对应的候选用户关注波动时长不能进行区分的问题,从而能够精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
58.在一种可以换的实施例中,在获取目标用户行为跟踪数据的目标用户行为跟踪标签时,存在待定用户行为跟踪标签不能精确地确定的问题,从而难以精确地获取目标用户行为跟踪数据的目标用户行为跟踪标签,为了改善上述技术问题,步骤w1所描述的获取目标用户行为跟踪数据的目标用户行为跟踪标签的步骤,具体可以包括以下步骤y1-步骤y3所描述的内容。
59.步骤y1,从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签。
60.步骤y2,若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签。
61.步骤y3,若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤。
62.可以理解,在执行上述步骤y1-步骤y3所描述的内容时,在获取目标用户行为跟踪数据的目标用户行为跟踪标签时,避免待定用户行为跟踪标签不能精确地确定的问题,从而能够精确地获取目标用户行为跟踪数据的目标用户行为跟踪标签。
63.基于上述基础,还可以包括以下步骤u1-步骤u4所描述的内容。
64.步骤u1,提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征。
65.可以理解的是,第一用户行为跟踪数据特征表示描述用户行为跟踪数据的重要属
性,比如,用户行为的波长、用户行为的频率以及用户行为的折损率等。
66.步骤u2,从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值。
67.步骤u3,若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系。
68.步骤u4,若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
69.可以理解,在执行上述步骤u1-步骤u4所描述的内容时,实时用户行为数据中包括多种跟踪数据对应的数据特征,将每一种数据特征映射到用户行为跟踪数据的用户关注波动时长中,这样能够提高判断第二用户行为跟踪数据特征与第一用户行为跟踪数据特征的相似度与预设相似度阈值大小关系的精确性。
70.基于上述基础,还包括以下步骤p1-步骤p3所描述的内容。
71.步骤p1,若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列。
72.步骤p2,确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的。
73.步骤p3,根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
74.可以理解,在执行上述步骤p1-步骤p3所描述的内容时,通过候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率与预设关联阈值的大小关系,能精确地确定目标跟踪数据子序列,因此,提高目标用户行为跟踪数据的关联用户行为跟踪数据序列的准确性。
75.在一种可替换的实施例中,步骤p3所描述的根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤k1和步骤k2所描述的内容。
76.步骤k1,若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
77.步骤k2,若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪
数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
78.可以理解,在执行上述步骤k1和步骤k2所描述的内容时,根据关联用户行为跟踪数据序列的数量逐一地进行相关计算,能够提高计算的准确性,从而能精确地确定目标跟踪数据子序列的并将其作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
79.在一些选择性的实施例中,上述步骤所描述的采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新,还可以包括以下步骤s251-步骤s256。
80.步骤s251,根据所述关联用户行为跟踪数据序列获取检测项目描述集,其中,所述检测项目描述集包括不间断的x组检测项目描述,所述x为大于或等于1的整数。
81.譬如,检测项目描述用于表征不同的检测项目情况。
82.步骤s252,根据所述检测项目描述集获取干扰描述集,其中,所述干扰描述集包括不间断的x组干扰描述。
83.譬如,干扰描述用于表征检测项目对应的偏差情况。
84.步骤s253,基于所述检测项目描述集,通过检测项目分析线程所包括的第一内容解析单元获取检测项目表达信息集,其中,所述检测项目表达信息集包括x个检测项目表达信息。
85.譬如,检测项目分析线程可以是基于人工智能的卷积神经网络。
86.步骤s254,基于所述干扰描述集,通过所述检测项目分析线程所包括的第二内容解析单元获取干扰表达信息集,其中,所述干扰表达信息集包括x个干扰表达信息。
87.譬如,内容解析单元可以是特征提取层。
88.步骤s255,基于所述检测项目表达信息集以及所述干扰表达信息集,通过所述检测项目分析线程所包括的用户关注波动分类单元获取所述检测项目描述所对应的检测需求标签。
89.譬如,用户关注波动分类单元可以是全连接层。
90.在一些可选的实施例中,所述基于所述检测项目表达信息集以及所述干扰表达信息集,通过所述检测项目分析线程所包括的用户关注波动分类单元获取所述检测项目描述集所对应的检测需求标签,包括:基于所述检测项目表达信息集,通过所述检测项目分析线程所包括的第一位置关注单元获取x个第一项目特征,其中,每个第一项目特征对应于一个检测项目表达信息;基于所述干扰表达信息集,通过所述检测项目分析线程所包括的第二位置关注单元获取x个第二项目特征,其中,每个第二项目特征对应于一个干扰表达信息;对所述x个第一项目特征以及所述x个第二项目特征进行整合处理,得到x个目标项目特征,其中,每个目标项目特征包括一个第一项目特征以及一个第二项目特征;基于所述x个目标项目特征,通过所述检测项目分析线程所包括的所述用户关注波动分类单元获取所述检测项目描述集所对应的检测需求标签。
91.在一些可选的实施例中,所述基于所述检测项目表达信息集,通过所述检测项目分析线程所包括的第一位置关注单元获取x个第一项目特征,包括:针对所述检测项目表达信息集中的每组检测项目表达信息,通过所述第一位置关注单元所包括的全局分类层获取
第一全局聚类表达信息,其中,所述第一位置关注单元属于所述检测项目分析线程;针对所述检测项目表达信息集中的每组检测项目表达信息,通过所述第一位置关注单元所包括的局部分类层获取第一局部聚类表达信息;针对所述检测项目表达信息集中的每组检测项目表达信息,基于所述第一全局聚类表达信息以及所述第一局部聚类表达信息,通过所述第一位置关注单元所包括的特征压缩层获取第一合成表达信息;针对所述检测项目表达信息集中的每组检测项目表达信息,基于所述第一合成表达信息以及所述检测项目表达信息,通过所述第一位置关注单元所包括的第一局部分类层获取第一项目特征。
92.步骤s256,根据所述检测需求标签确定所述检测项目描述集的更新引导策略,采用所述更新引导策略对所述目标用户行为跟踪数据进行更新。
93.譬如,可以确定目标用户行为跟踪数据和关联用户行为跟踪数据序列的比对结果,然后结合比对结果,采用更新引导策略对所述目标用户行为跟踪数据进行更新,从而便于后续用户行为跟踪数据的正常使用。
94.可以理解的是,通过上述步骤s251-步骤s256,能够借助检测项目分析线程确定更新引导策略,从而采用更新引导策略对所述目标用户行为跟踪数据进行更新,以考虑不同的检测项目的具体情况,这样可以确保更新与实际检测情况的适配性。
95.基于同样的发明构思,还提供了基于大数据电商优化的用户行为数据处理系统,所述系统包括用户行为跟踪服务器和云计算服务器,所述用户行为跟踪服务器与所述云计算服务器通信连接,云计算服务器具体用于:获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
96.进一步的,云计算服务器具体用于:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数
据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
97.进一步的,云计算服务器具体用于:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述方法还包括:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态;所述分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
98.进一步的,云计算服务器具体用于:从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签;若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签;若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤。
99.进一步的,云计算服务器具体用于:提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征;从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值;若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系;若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
100.进一步的,云计算服务器具体用于:若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列;确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
101.进一步的,云计算服务器具体用于:若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
102.进一步的,云计算服务器具体用于:采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新。
103.基于上述同样的发明构思,请结合参阅图3,还提供了基于大数据电商优化的用户行为数据处理装置400的功能模块框图,关于所述基于大数据电商优化的用户行为数据处理装置400的详细描述如下。
104.基于大数据电商优化的用户行为数据处理装置400,应用于云计算服务器,所述装
置400包括:数据获取模块410,用于获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;序列确定模块420,用于分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;子序列确定模块430,用于确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;数据更新模块440,用于根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
105.本技术提供了一种云计算服务器,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与云计算服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述的方法。
106.本技术提供了一种应用于计算机的可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在云计算服务器的内存中运行时实现上述的方法。
107.综上,基于上述方案,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
108.当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
109.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本技术的范围仅由所附的权利要求来限制。