本发明涉及一种应用技术领域,特别地涉及一种素材筛选方法和系统。
背景技术:
发现和应用受用户欢迎度高的素材是应用(app)开发者和运营者非常关注的问题。在现有技术中,通常采用abtest的方法来确定素材。所述的abtest,是指为同一个目标制定ab两个方案(比如两个页面、两个图片等),让一部分用户使用a方案,另一部分用户使用b方案,记录下用户的使用情况,根据对ab两个方案的使用情况确定哪个方案更符合设计目标。然而,随着用户量增大、分享量增长、用户的构成变得愈发复杂,abtest已无法满足需求。
技术实现要素:
针对现有技术中存在的技术问题,本发明提出了素材筛选方法和系统,用于高效率地筛选出需要分享的素材,对素材的热度反应快,流量分配合理。
为了解决上述技术问题,根据本发明的一个方面,本发明提供了一种素材筛选方法,包括:
验证第一集合中的各个素材;
将第一集合中符合预定分享率的素材加入到第二集合中;
获得第二集合中各个素材的曝光率;以及
将第二集合中曝光率排名中符合预定名次的素材淘汰到素材队列中,曝光率与素材的浏览次数相关。
优选地,验证第一集合中的各个素材的步骤包括:获取第一集合中的各个素材在预定时间段内的分享量。
优选地,符合预定分享率为在所述预定时间段内分享次数超过预定阈值,其中预定时间段为10-30分钟,所述预定阈值为2000-6000次。
优选地,所述的素材筛选方法还进一步包括:响应于第二集合中曝光率排名前一个或多个素材保持不变的时间达到计时阈值时,将第一集合中符合预定分享率的素材加入到第二集合中。
优选地,曝光率为第二集合中各个素材在当前时间切片内的浏览次数及分享量的比值。
优选地,所述的素材筛选方法进一步包括将素材队列中权重最高一个或多个的素材加入到第一集合中。
优选地,素材队列中各个素材的淘汰次数越高,素材的权重越低。
优选地,所述的素材筛选方法还包括:当第一集合中的各个素材的数量小于预置数量时,将素材队列中权重最高的一个或多个素材加入到第一集合中。
优选地,第一集合中的各个素材的数量保持不变。
优选地,第二集合中的各个素材的数量不小于5个。
根据本发明的一个方面,本发明提供了一种素材筛选系统,包括:
素材验证模块,用于验证第一集合中的各个素材,将第一集合中符合预定分享率的素材加入到第二集合中;以及
素材竞争模块,用于获得第二集合中各个素材的曝光率,将第二集合中曝光率排名中符合预定名次的素材淘汰到素材队列中,其中曝光率与素材的浏览次数相关。
优选地,所述素材验证模块包括:
第一分享量统计单元,用于统计第一集合中各个素材在预定时间段内的分享量;
第一计时单元,用于对第一集合中各个素材的验证时间进行计时;
比较单元,用于比较所述第一集合中各个素材在预定时间段内的分享量与预定阈值的大小;以及
第二发送单元,当素材在预定时间段内的分享量大于或等于所述分享阈值时,所述素材通过验证,将其材补充到第二集合中。
优选地,所述预定时间段为10-30分钟,所述预定阈值为2000-6000次。
优选地,所述的素材筛选系统进一步包括素材提供模块,用于获取素材队列中各个素材的权重,将素材队列中权重最高一个或多个的素材加入到第一集合中。
优选地,所述素材验证模块还包括:
素材补充单元,用于当第一集合中素材的数量小于预置数量时,向所述素材提供模块发送素材补充请求。
优选地,所述素材提供模块包括:
权重计算单元,用于计算素材队列中每个素材的权重;
第一排序单元,用于按照权重从高到低的顺序对素材队列中的素材进行排序;以及
第一发送单元,用于将素材队列中权重最高的一个或多个素材补充到第一集合中。
优选地,所述素材竞争模块包括:
第二分享量统计单元,用于统计各个素材在当前时间切片内的分享量;
计算单元,用于计算浏览次数和分享量的比值得到所述素材的曝光率;
第二排序单元,用于对第二集合中的各个素材按照曝光率进行排序;以及
第三发送单元,用于将第二集合中曝光率排名中符合预定名次的素材淘汰到素材队列中。
优选地,所述素材竞争模块还包括:
第二计时单元,用于对第二集合中曝光率排名前一个或多个素材保持不变的状态进行计时,在达到计时阈值时,向素材验证模块发送素材更新请求。
本发明提供的素材筛选方法和系统可适应大流量、高质量的运营需求,能够对大量的数据及时分析,所以对素材热度的反应迅速。通过不断地对素材进行对比和分析,得到最优组合的素材,最大化地利用了流量。
附图说明
下面,将结合附图对本发明的优选实施方式进行进一步详细的说明,其中:
图1是根据本发明的一个实施例的素材筛选方法的流程图;
图2a-2c是根据本发明的一个实施例的三种素材集合中素材转移的示意图;
图3是根据本发明的一个实施例的素材筛选系统的原理框图;
图4是根据本发明的一个实施例的素材提供模块的原理框图;
图5是根据本发明的一个实施例的素材验证模块的原理框图;以及
图6是根据本发明的一个实施例的素材竞争模块的原理框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。
所谓“素材”是指能够分享和浏览的内容。素材可以是图片或者图片的一部分、文章或者文章的一部分、视频或者视频的一部分、音频或者音频的一部分等等。素材可以很短,例如一个口号或者一个动图;素材也可以很长,例如一篇文章或者一段视频。在一些实施例中,素材可以附加广告而成为广告的载体。在一些实施例中,素材本身也可以成为广告或者广告的一部分。
为了筛选出高欢迎度的素材,本发明将所有的素材分为三个集合:素材队列a、第一集合b和第二集合c。其中,可以分享的素材全部放在素材队列a,第一集合b中的素材为从素材队列a中选出的欢迎度高的素材,这些素材需要经过验证,在验证通过后转移到第二集合c。第二集合c中通过排名,始终保持排名在前的一个或多个素材,其为筛选出来的欢迎度最高的素材,可以将其推荐给用户。并且,本发明实时监测各个素材的分享情况及浏览情况。通过统计一个素材在一个时间切片内的分享量(分享总次数)及其被浏览的次数,可以得到该素材在该时间切片内的曝光率。其中时间切片可以根据需要进行设置,如20分钟的一段时间,5分钟的一段时间等。
具体地,如图1所示,为本发明所述素材筛选方法的流程图,图2a-2c为本发明中涉及到的三种素材集合中素材转移的示意图,结合图1和图2a-2c,所述素材筛选方法包括以下步骤:
步骤s1,获取素材队列a中每个素材的权重。在本发明中,可以用于分享的素材都放在素材队列中,每个素材都有各自的权重。这里所述的权重是淘汰权重,即最后竞争排名时淘汰后产生的权重。素材队列a中素材的权重与素材的淘汰次数呈反比,在素材每淘汰一次时,其淘汰次数加1,新素材的淘汰次数为初始值1。素材淘汰的次数越多,权重越低。例如,假设当前素材队列a中的素材个数为assetlength,c1为淘汰次数,ca为淘汰次数之和。采用权重公式:weight=(|c1-assetlength|+1)/ca来计算素材的权重。比如现有5个素材,assetlength=5,这5个素材的淘汰次数c1分别是1,2,3,4,5,因而,ca=15,
这5个素材的权重weight计算实例如下:
(|1-5|+1)/15=0.333333333
(|2-5|+1)/15=0.266666667
(|3-5|+1)/15=0.2
(|4-5|+1)/15=0.133333333
(|5-5|+1)/15=0.066666667
步骤s2,将素材队列a中当前权重最高的素材补充到待第一集合b中,如图2a所示。在获得了素材队列a中各个素材的权重后,可以对素材进行排序。将素材队列a中的素材补充到第一集合b中的操作可有两种,一种是在规定的时间到达时主动补充。例如,本发明中将计算素材队列a中的素材的权重、排名,及将素材补充到待第一集合b的这一系列操作可以定时或定频实施,如每20分钟进行一次。在规定的20分钟到达时,进行计算、排序,并转移素材。
另一种是根据要求被动补充,即素材的权重、排名可以采用定时定频实施,但是素材的转移根据接收到的请求来实施。例如,在第一集合b中的素材数量已少于可处理的预置数量,如100个时,处理装置会请求素材队列a补充素材,此时,根据请求,向第一集合b被动补充素材。
补充素材的数量可以是设定的数量,也可以是请求的数量。例如,可以设置将素材队列a中当前权重最高的10个素材补充到第一集合b中。又例如,第一集合b中的素材数量为处理装置能处理的设定量,如果第一集合b中的当前素材数量缺少m个,则在请求素材队列a补充素材时,也会给出请求的数量m。此时,根据请求的数量,将素材队列a中当前权重最高的m个素材补充到第一集合b中。
步骤s3,验证第一集合b中的各个素材。在步骤2中获得了权重较大的素材,但是这些素材是否真的受欢迎,需要进行测试才可以参与后续的竞争排名。首先获取每个素材在其验证时间段内的分享量,例如,所述验证时间段可设为10-30分钟,针对这个素材,监测在这个时间段内有多少分享事件发生。然后比较其分享量与分享阈值的大小,例如分享阈值为2000-6000次中的一个适当值,如果所述素材在验证时间段内的分享量大于或等于分享阈值时,也就是说,该素材符合预定分享率,则所述素材通过验证。如果所述素材在验证时间段内的分享量小于分享阈值时,等待下一次的计算。
步骤s4,将通过验证的素材补充到第二集合c中,如图2b所示。补充素材到第二集合c中的时刻可以有多种选择。例如,第二集合c中的素材需要更新时,会发送素材补充请求,根据该请求,将通过验证的素材补充到第二集合c中。
步骤s5,对第二集合c中的素材按照曝光率进行排序,符合预定名次的素材淘汰到素材队列中。在一个实施例中,第二集合c中的素材保持为10个,将曝光率低于前10名的素材淘汰到素材队列a中,如图2c所示。其中,作为一个较好的实施例,为了增加素材的稳定性,设置了更新频率,例如每5分钟对第二集合c中的素材更新一次。通过对当前第二集合c保持前10名素材的状态进行计时,在达到计时阈值(即更新时间5分钟)时,将通过验证的素材补充到第二集合c中。此时,对第二集合c中的素材进行排序,将低于规定的、前10名的素材淘汰到素材队列a中。
其中,素材的曝光率可以代表该素材的受欢迎程度。首先统计素材在当前时间切片内的分享量及其浏览次数,所述曝光率等于浏览次数和分享量的比值,该素材的浏览次数越高,说明喜欢该素材的人越多,而也说明了该素材的受欢迎的程度越高。
为了实现上述方法,本发明还提供了一种素材筛选系统,如图3所示,所述系统包括:素材提供模块1、素材验证模块2和素材竞争模块3。
其中,如图4所示,为所述素材提供模块1的具体原理框图。所述素材提供模块1包括权重计算单元11、第一排序单元12和第一发送单元13。其中,所述权重计算单元11计算素材队列中每个素材的权重。所述第一排序单元12按照权重从高到低的顺序对素材队列中的素材进行排序。所述第一发送单元13将素材队列中权重最高的素材作为待验证素材补充到待第一集合b中。如前述方法步骤中实施例所示,素材的转移发生在两种情况:定时、定频到达时,或者是应素材验证模块2的请求。补充的素材数量,可以是一次补充一个,也可以是多个,还可以是请求的数量。
如图5所示,为素材验证模块的原理框图。所述素材验证模块2包括:第一分享量统计单元21第一计时单元22、比较单元23和第二发送单元24,其中,第一分享量统计单元21统计各个素材在验证时间段内的分享量。第一计时单元22用于对素材的验证时间进行计时,在计时时间(如30分钟)到达时,得到该段时间的素材的分享量。比较单元23比较所述各个素材在验证时间段内的分享量与分享阈值(如4000)的大小。当所述一个素材在验证时间段内的分享量大于或等于所述分享阈值4000时,所述素材通过验证。第二发送单元24将通过验证的素材补充到第二集合c中。
根据素材验证模块2的最佳处理能力,在一个具体实施例中,将第一集合b中的素材数量设置为100个,其可以使素材验证模块2处于最佳的处理效率,因而,需要使第一集合b一直保持100个素材。当将通过验证的素材作为补充到第二集合c中后,第一集合b中的素材会减少,此时需要及时向第一集合b补充。因而,素材验证模块2还包括素材要求单元25,其向所述素材提供模块1发送请求,并在请求中包括素材的数量。其中,所述请求中的数量可以为向第二集合c中补充的素材数量,即送出去多少,要求补充多少,从而可使第一集合b中的素材数量一直保持在最佳处理数量100。
如图6所示,为素材竞争模块的原理框图。所述素材竞争模块3包括:第二分享量统计单元31、计算单元32、第二排序单元33和第三发送单元34。其中,第二分享量统计单元3在有素材加入到第二集合c中时,统计第二集合c中每个素材在当前时间切片内的分享量及浏览次数。其中,所述的时间切片是素材竞争模块3为了对第二集合c中的各个素材进行排序,需要获取数据的时间段。计算单元32根据素材在该时间切片内的分享量及其浏览次数,通过计算浏览次数和分享量的比值得到所述素材的曝光率。第二排序单元33对第二集合c中的所有素材按照曝光率进行排序。由于此时当前的第二集合c中素材多于其设定数量,如10个,因而第三发送单元34将排名低于10个的素材发送回素材队列a中。
其中,为了保持第二集合c中素材的稳定,需要当前第二集合c中的10个素材保持一定的时间段,因而,所述素材竞争模块3还包括第二计时单元35,用于对第二集合中保持前10名的状态进行计时,例如,在第二排序单元33排完序之后开始计时,在达到计时阈值,如5分钟时,向所述素材验证模块2发送素材更新请求;对应地,所述素材验证模块2中的第二发送单元24将通过验证的素材补充到第二集合c中。其中,补充的数量可以1个,也可以是多个,具体可以人为设定。
在以上说明中,所述的第一……单元、第二……单元,并不是数量的限定,仅是为了区分不同模块内用于完成相同功能的单元。并且,上述说明中的实施例仅供说明本发明之用,而并非是对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明范围的情况下,还可以做出各种变化和变型,因此,所有等同的技术方案也应属于本发明公开的范畴。