应用程序的筛选方法、装置和系统与流程

文档序号:11918731阅读:441来源:国知局
应用程序的筛选方法、装置和系统与流程

本发明涉及互联网领域,具体而言,涉及一种应用程序的筛选方法、装置和系统。



背景技术:

终端上能够安装的APP数量庞大,从海量的APP中筛选出成长型APP和衰退型APP具有重要价值。

现有技术一般根据APP的装机量变化率由高到低进行排名获取成长型APP或衰退型APP。这种判断方法准确率低。比如一些厂商定制的APP,只要推出一款新机型,装机量就会立刻上升,但这款APP本身不一定是成长型APP。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种应用程序的筛选方法、装置和系统,以至少解决现有技术中使用单一参数筛选应用程序的准确度低的技术问题。

根据本发明实施例的一个方面,提供了一种应用程序的筛选方法,包括:获取N个应用程序的第一参数和第二参数,其中,所述第一参数是用于表示所述应用程序的装机量的参数,所述第二参数是用于表示所述应用程序的用户的活跃程度的参数;根据所述第一参数和所述第二参数从所述N个应用程序中筛选出目标应用程序。

根据本发明实施例的又一个方面,提供了一种应用程序的筛选装置,包括:获取单元,用于获取N个应用程序的第一参数和第二参数,其中,所述第一参数是用于表示所述应用程序的装机量的参数,所述第二参数是用于表示所述应用程序的用户的活跃程度的参数;第一筛选单元,用于根据所述第一参数和所述第二参数从所述N个应用程序中筛选出目标应用程序。

根据本发明实施例的又一个方面,提供了一种应用程序的筛选系统,包括:上述应用程序的筛选装置。

根据本发明实施例的又一个方面,提供了一种应用程序的筛选系统,包括:终端,用于将N个应用程序的安装情况和使用情况上报给服务器;服务器,与所述终端通信连接,用于接收所述终端上报的所述N个应用程序的安装情况和使用情况,并根据所述安装情况和所述使用情况获取所述N个应用程序的第一参数和第二参数,并且根据所述第一参数和所述第二参数从所述N个应用程序中筛选出目标应用程序,其中,所述第一参数是用于表示所述应用程序的装机量的参数,所述第二参数是用于表示所述应用程序的用户的活跃程度的参数。

本发明实施例使用装机量(安装量)和活跃度(使用量)两个方面的多个参数作为特征,由于多个参数全面地反映了应用程序的安装和使用情况,达到了筛选应用程序的准确度高的技术效果,进而解决了现有技术中使用单一参数筛选应用程序的准确度低的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的执行应用程序的筛选方法的终端和服务器所构成的硬件环境的架构图;

图2是根据本发明实施例的一种可选的应用程序的筛选方法的流程图;

图3是根据本发明实施例的另一种可选的应用程序的筛选方法的流程图;

图4是根据本发明实施例的使用KMENS聚类算法进行聚类的示意图;

图5是根据本发明实施例的使用DBSCAN聚类算法进行聚类的示意图;

图6是根据本发明实施例的应用程序的筛选装置的示意图;

图7是根据本发明实施例的用于实施应用程序的筛选方法的服务器的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

下面对本发明实施例中出现的技术术语进行解释:

APP:application的缩写,特指手机上的应用程序。

表现特殊的APP:主要指近期发展势头较好或较差的一些APP,即区别于表现形式一般的APP(稳定的APP)。

IMEI:国际移动设备识别码(International Mobile Equipment Identity,IMEI),即通常所说的手机序列号、手机“串号”,用于在移动电话网络中识别每一部独立的手机等行动通讯装置。

APP装机量:指安装某款APP的总用户数。

APP活跃用户数:指某款APP被使用的总用户数。

手机管家:是主要包含手机病毒查杀、垃圾清理、骚扰拦截、流量管理、软件管理等功能的手机管理软件。

大盘:指所有APP整体上报的情况,比如通过手机管家收集到所有APP整体装机量或者使用用户的总量的情况。

聚类分析:聚类(clustering)是指根据“物以类聚”原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做类或簇,在同一类中,个体之间的差异较小,而不同类上的个体之间的差异较大。

训练样本:在本发明中指聚类算法训练模型(学习如何聚类)用到的样本数据。

根据本发明实施例,提供了一种可以通过本申请装置实施例执行的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

根据本发明实施例,提供了一种应用程序的筛选方法。

可选地,在本实施例中,上述应用程序的筛选方法可以应用于如图1所示的第一终端102、第二终端106和服务器104所构成的硬件环境中。如图1所示,第一终端102和第二终端106可以通过网络与服务器104进行连接,第一终端102也可以不与服务器104连接。在第一终端102不与服务器104连接的情况下,第一终端102和第二终端106之间也可以进行通信。上述网络包括但不限于:移动通信网络、广域网、城域网或局域网,终端102可以是手机终端,也可以是PC终端、笔记本终端或平板电脑终端。

图1中示出的硬件环境系统的主要工作原理是:

第一终端102、第二终端106的手机管家客户端向服务器104上报用户软件安装列表和用户使用列表。服务器104根据用户软件安装列表和用户使用列表获取表示应用程序的装机量的参数和用户活跃度的参数,根据应用程序的装机量的参数和用户活跃度的参数对应用程序进行聚类,被聚到一起的应用程序即为表现普通的APP,未被聚类的应用程序为表现特殊的APP,即目标应用程序。需要注意的是,图1中的第一终端102、第二终端106仅仅是示意性的,在本发明实施例中需要大量终端的手机管家客户端向服务器104上报用户软件安装列表和用户使用列表。

根据本发明实施例,提供了一种应用程序的筛选方法。

图2是根据本发明实施例的一种可选的应用程序的筛选方法的流程图。如图2所示,该方法包括如下步骤:

步骤S202,获取N个应用程序的第一参数和第二参数,其中,第一参数是用于表示应用程序的装机量的参数,第二参数是用于表示应用程序的用户的活跃程度的参数。

步骤S204,根据第一参数和第二参数从N个应用程序中筛选出目标应用程序。

现有技术筛选APP的方法是根据APP的装机量变化率由高到低进行排名获取成长型APP或衰退型APP,这种方法的缺点是不同装机量级APP装机量变化率上也存在很大差异,对于一个装机量比较少的APP,即使近期装机量变化很大,也不能确定此款APP就是表现突出的APP,因此很难确定装机量上升或下降多少才算表现特殊的APP,因此,现有技术筛选APP的方法准确度低。

本发明实施例使用装机量(安装量)和活跃度(使用量)两个方面的多个参数作为特征,由于多个参数全面地反映了应用程序的安装和使用情况,因此,解决了现有技术中使用单一参数筛选应用程序的准确度低的技术问题,达到了筛选应用程序的准确度高的技术效果。

图3是根据本发明实施例的另一种可选的应用程序的筛选方法的流程图。如图3所示,该方法包括如下步骤:

步骤S302,数据源收集。

步骤S304,特征指标提取。

步骤S306,训练样本生成。

步骤S308,聚类算法进行聚类分析。

步骤S310,获取表现特殊的APP。表现特殊的APP即为上述目标应用程序。

下面对数据源收集(步骤S302)做出详细说明:

本发明以装机量(安装量)和活跃度(使用量)两个方面表征APP的表现,APP装机量数据通过客户端上报的用户软件安装列表获取,APP活跃度都通过客户端上报的用户使用列表获取。

1)上报的用户软件安装列表日志格式如下(一个IMEI表示一个手机终端)。

IMEI1,APP1、APP2、APP3……

IMEI2,APP31、APP3、APP5……

……

2)上报的用户软件使用列表日志格式如下:

IMEI1,APP1、begin_time、end_time、use_cnt(使用次数)、use_time(使用时长)

IMEI1,APP2、begin_time、end_time、use_cnt(使用次数)、use_time(使用时长)

IMEI2,APP1、begin_time、end_time、use_cnt(使用次数)、use_time(使用时长)

……

用户使用APP的列表记录某个用户对某款APP在某段时间内使用次数和使用时长信息,这里的使用指当用户打开某款APP并在手机终端屏幕运行的情况(非后端运行状态)。如果用户打开过某款APP并在手机终端屏幕运行,则该用户为活跃用户,也是第一用户。

下面对特征指标提取(步骤S304)做出详细说明:

收集到客户端所有用户(日活跃用户大约9千万)的软件安装列表和软件使用列表之后,以APP为维度,统计各个APP安装量变化和活跃度变化两个方面的多项特征指标,来表征APP近期表现趋势。特征指标即为上述第一参数和第二参数。

第一参数是装机量方面的参数。第一参数可以包括以下两个中的至少一个参数:当前(本周相对上周)周期装机量变化率、上周期(上周相对上上周)装机量变化率。

当前(本周相对上周)周期装机量变化率=(本周APP1装机量/本周大盘总装机量-上周APP1装机量/上周大盘总装机量)/(上周APP1装机量/上周大盘总装机量)

上周期(上周相对上上周)装机量变化率=(上周APP1装机量/上周大盘总装机量-上上周APP1装机量/上上周大盘总装机量)/(上上周APP1装机量/上上周大盘总装机量)

以APP1为例,某个周期内APP1的装机量指该周期内收集的所有用户的软件安装列表中安装APP1的用户数,某个周期内APP1的使用总次数指该周期内该APP1的所有活跃用户使用APP1的总次数,某个周期内APP1的使用总时长指该周期内该APP1的所有活跃用户使用APP1的总时长。

第二参数是用户的活跃度方面的参数。第二参数可以包括以下任意一个或多个子参数:当前周期应用程序的第一用户数量的变化率、上个周期应用程序的第一用户数量的变化率、当前周期应用程序总使用次数的变化率、上个周期应用程序总使用次数的变化率、当前周期应用程序总使用时长的变化率、上个周期应用程序总使用时长的变化率。

当前周期活跃用户数变化率=(本周APP1活跃用户数/本周大盘活跃总用户数-上周APP1活跃用户数/上周大盘活跃总用户数)/(上周APP1活跃用户数/上周大盘活跃总用户数)

上周期活跃用户数变化率=(上周APP1活跃用户数/上周大盘活跃总用户数-上上周APP1活跃用户数/上周大盘活跃总用户数)/(上周APP1活跃用户数/上周大盘活跃总用户数)

当前周期APP总使用次数变化率=(本周APP1总使用次数/本周大盘总使用次数-上周APP1总使用次数/上周大盘总使用次数)/(上周APP1总使用次数/上周大盘总使用次数)

上周期APP总使用次数变化率=(上周APP1总使用次数/上周大盘总使用次数-上上周APP1总使用次数/上上周大盘总使用次数)/(上上周APP1总使用次数/上上周大盘总使用次数)

当前周期APP总使用时长变化率=(本周APP1总使用时长/本周大盘总使用时长-上周APP1总使用时长/上周大盘总使用时长)/(上周APP1总使用次时长上周大盘总使用时长)

上周期APP总使用时长变化率=(上周APP1总使用时长/上周大盘总使用时长-上上周APP1总使用时长/上上周大盘总使用时长)/(上上周APP1总使用时长/上上周大盘总使用时长)

其中大盘装机量指通过手机管家客户端上报用户软件列表总用户数,大盘活跃总用户数指上报用户使用APP列表的总用户数,大盘总使用次数指上报软件使用的所有用户使用各个APP总次数,大盘总使用时长指上报软件使用的所有用户使用各个APP总使用时长。

上述实施例中的时间周期可以是周,或者月、季度等,可以采用不同的时间周期来统计APP的这些特征指标(第一参数和第二参数)。

下面对训练样本生成(步骤S306)做出详细说明:

可选地,在根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的相似度之前,可以过滤掉N个应用程序中用户数量小于第三预设数值的应用程序。

可选地,在根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的相似度之前,可以过滤掉N个应用程序中装机量小于某个数值的应用程序。

APP数量达百万级,如果要计算全部APP中每个APP与其他APP的相似度,则工作量十分巨大。在本发明实施例中,关注装机量特别小或者用户数量特别小的APP的意义不大,没有必要关注装机量特别小或者用户数量特别小的APP,可以直接将那些装机量特别小或者用户数量特别小的APP过滤掉。在本发明实施例中,也不关注某些android内置的APP,因此,可以将android内置的一些APP也过滤掉。

当根据以上公式计算出第一参数和第二参数之后,根据第一参数和第二参数从N个应用程序中筛选出目标应用程序(表现特殊的APP)。

表现特殊的APP可以分为两类,一类是发展势头好的成长型APP,另一类是发展势头差的衰退型APP。成长型APP的特点是:装机量越来越多、且装机量变化率大,活跃用户越来越多且活跃用户的增加很快,APP总使用次数多越来越多且总使用次数上升快,APP总使用时长越来越长且总使用时长的变化快。衰退型APP的特点是:装机量越来越少,活跃用户越来越少,APP总使用次数越来越少,APP总使用时长越来越短。

由于表现特殊的APP在装机量和用户活跃度方面与表现普通的APP有较大的差异,因此,根据第一参数和第二参数能够从N个应用程序中筛选出表现特殊的APP。

本发明实施例还提供了使用聚类算法对APP进行聚类以筛选出表现特殊的APP的过程。

下面对聚类算法进行聚类分析(步骤S308)和获取表现特殊的APP(步骤S310)做出详细说明:

表现普通的APP,一般都会有和它表现近似的APP,使用聚类算法,可以很好地将表现普通的APP聚在一起,那些未被聚在一起的APP,即为表现特殊的APP,这样就可以消除APP量级上面的影响。聚类算法本身会考虑到横向和纵向的对比,因此使用本发明实施例的筛选方法得到的目标应用程序的准确度高。表现特殊的APP可能是发展势头越来越好的成长型APP,也可能是发展势头越来越差的衰退型APP。当筛选出表现特殊的APP之后,根据第一参数和第二参数将该APP划分为成长型APP或者衰退型APP。

通过聚类算法使用步骤S304中得到的特征指标(第一参数和第二参数)作为特征对训练样本进行聚类分析,表现普通的APP一般都有与之表现形式类似的APP,聚类分析的目的是将表现比较普通的APP聚到各个类中。

需要注意的是,通过聚类算法使用步骤S304中得到的特征指标(第一参数和第二参数)作为特征对训练样本进行聚类分析的过程中,对使用的特征指标的数量,并无特殊限制,可以使用以下任意多个(2至8个)作为特征指标:当前(本周相对上周)周期装机量变化率、上周期(上周相对上上周)装机量变化率、当前周期应用程序的第一用户数量的变化率、上个周期应用程序的第一用户数量的变化率、当前周期应用程序总使用次数的变化率、上个周期应用程序总使用次数的变化率、当前周期应用程序总使用时长的变化率、上个周期应用程序总使用时长的变化率。

一般情况下,当使用的特征指标的数量越多时,越能够全面表现应用程序的安装和使用情况,因而聚类效果也越好,准确度越高。

本发明实施例提供了以下三种聚类方法。

聚类方法一:

根据第一参数和第二参数将N个应用程序进行聚类,得到至少两个类别,筛选出第一应用程序,其中,第一应用程序偏离第一应用程序所在类别的中心的程度大于第一预设数值。聚类方法一是一种基于距离的聚类算法,距离相近的点将会被聚到一个类中,例如KMENS聚类算法。

以KMENS聚类算法为例进行说明,KMENS聚类算法的基本思想如下:

1、创建k个点作为初始的质心点(随机选择)

2、重复下面过程直到收敛

{

对数据集中的每一个数据点

计算k个质心与数据点的距离

将数据点分配到距离最近的类

对每一个类,计算类中所有点的均值,并将均值作为质心

}

k的取值是任意的,例如,可以尝试多种k的取值,然后找出聚类效果最好的k的取值。例如,当k=4时,聚类结果如图4所示。在图4中,一共有4个框,分别为框L4-1、框L4-2、框L4-3和框L4-4。每个框中包括若干点,五角星为每个框的中心点,以五角星为圆心,以R1(第一预设数值)为半径画圆,得到4个圆,分别为圆Y1、圆Y2、圆Y3和圆Y4。则4个圆外的点偏离自身所处的类别的中心的程度大于第一预设数值,处于4个圆外的点都是表现特殊的。即,箭头标注的点所表示的应用程序是表现特殊的。

聚类方法二:

根据第一参数和第二参数将N个应用程序进行聚类,得到至少两个类别,其中,每个类别中的应用程序周围的应用程序的稠密程度在预设范围内,然后筛选出处于至少两个类别以外的应用程序。聚类方法二是一种基于密度的聚类算法,例如DBSCAN聚类算法。DBSCAN是一个基于密度的聚类算法,点集被聚成两类,如图5所示,一共有2个不规则的框,分别为框L5-1和框L5-2。每个框中包括若干点,每个框中的所有点都被聚到同一类,而不同框中点的类别不同,不属于任何一个框的点即为离散点(箭头标注的点)。这些离散点代表的应用程序是表现特殊的应用程序。

聚类方法三:

根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的距离参数,其中,距离参数用于表示每个应用程序与其他应用程序之间的相似程度,然后筛选出距离参数大于预设距离的应用程序。聚类方法三是一种基于密度的聚类算法,例如OPTICS算法。OPTICS算法和DBSCAN算法原理类似,只不过给出一个到达距离(距离参数)的概念,类似于离散程度,到达距离越大,表明越离散。

可以为距离参数设置一个阈值(预设距离),那些距离参数大于预设距离的应用程序都被认为是表现特殊的。

采用OPTICS聚类算法计算APP的到达距离时,计算得到的绝大多数APP的到达距离很小,例如小于0.05,则可以设置预设距离为0.05,到达距离大于0.05的APP即为表现特殊的APP。表1给出某一个周期采用OPTICS聚类算法筛选出的表现特殊的12个APP(装机量10万以上),这12个APP的到达距离均大于0.05。表1中的第一用户即为活跃用户。

表1

需要注意的是,本发明实施例中使用的聚类算法不限于KMEANS、DBSCAN和OPTICS三种聚类算法。

当N的量级为十万、百万或者更大时,将APP聚类后,表现普通的APP往往会被聚到一起,而且形成的类中包含的APP的数量很大,可以达到上百、上千甚至上万;而表现特殊的APP往往不会聚到一起,即使聚到一起,形成的类中包含的APP的数量也很小。因此,包含APP的数量非常少的类别所包含的APP具有特殊性。为了找出这些APP,将APP聚类后,从得到的多个类别中筛选出目标类别,其中,目标类别中包含的应用程序的数量小于或者等于第二预设数值,将目标类别中所有的应用程序作为目标应用程序。

例如,假定第二预设数值是10,N为100万,将100万个APP聚类后,得到10类,如表2所示,类别C6中包含APP的数量仅为5。也就是说,虽然这5个APP之间的相似度较高,但是由于类别C6中包含APP的数量太少,这5个APP有可能都是表现特殊的,类别C6即为目标类别,类别C6中包含的5个APP都是目标应用程序。

表2

本发明实施例提供的应用程序的筛选方法能够快速准确从海量APP中挖掘近期表现特殊的APP。

本发明实施例使用装机量(安装量)和活跃度(使用量)两个方面的参数作为特征,使用多个参数计算应用程序与其他应用程序的相似度,由于表现普通的应用程序与其他应用程序的相似度较高,而表现特殊的应用程序与其他应用程序的相似度较低,能够根据相似度从海量应用程序中筛选出表现比较特殊的应用程序,由于多个参数全面地反映了应用程序的安装和使用情况,因此,解决了现有技术中使用单一参数筛选应用程序的准确度低的技术问题,达到了筛选应用程序的准确度高的技术效果。进一步地,在计算相似度的过程中既有应用程序自身不同周期的纵向对比,又有应用程序与其他应用程序的横向对比,使得筛选应用程序的准确度高。

表现特殊的APP即为目标应用程序。表现特殊的APP可以分为两类,一类是发展势头好的成长型APP,另一类是发展势头差的衰退型APP。成长型APP的特点是:装机量越来越多、且装机量变化率大,活跃用户越来越多且活跃用户的增加很快,APP总使用次数多越来越多且总使用次数上升快,APP总使用时长越来越长且总使用时长的变化快。衰退型APP的特点是:装机量越来越少,活跃用户越来越少,APP总使用次数越来越少,APP总使用时长越来越短。当根据本发明实施例提供的应用程序的筛选方法筛选出表现特殊的APP之后,根据第一参数和第二参数将表现特殊的APP分为成长型APP或者衰退型APP。对于成长型APP,可以加大推广力度。对于衰退型APP,可以减弱推广力度。

下面给出一个具体的实施例说明本发明实施例提供的应用程序的筛选方法。

本发明实施例以装机量(安装量)和活跃度(使用量)两个方面表征APP表现形式,APP装机量数据通过客户端上报的用户软件安装列表获取,APP活跃度都通过客户端上报的用户使用列表获取。

计算以下8个特征指标:

当前(本周相对上周)周期装机量变化率、上周期(上周相对上上周)装机量变化率、当前周期应用程序的第一用户数量的变化率、上个周期应用程序的第一用户数量的变化率、当前周期应用程序总使用次数的变化率、上个周期应用程序总使用次数的变化率、当前周期应用程序总使用时长的变化率、上个周期应用程序总使用时长的变化率。

在海量的应用程序中过滤掉android内置的一些应用程序,并且过滤掉装机量特别小或者活跃用户数量特别小的应用程序,将其余的应用程序作为训练样本。

通过OPTICS算法使用计算出的8个特征指标对训练样本进行聚类分析,OPTICS算法能够给出一个到达距离(距离参数)的概念,可以为距离参数设置一个阈值(预设距离),那些距离参数大于预设距离的应用程序都被认为是表现特殊的。采用OPTICS聚类算法计算APP的到达距离时,计算得到的绝大多数APP的到达距离很小,例如小于0.05,则可以设置预设距离为0.05,到达距离大于0.05的APP即为表现特殊的APP。表1给出某一个周期采用OPTICS聚类算法筛选出的表现特殊的12个APP(装机量10万以上),这12个APP的到达距离均大于0.05。表1中的第一用户即为活跃用户。

本发明实施例使用装机量(安装量)和活跃度(使用量)两个方面的参数作为特征,使用多个参数计算应用程序与其他应用程序的相似度,由于表现普通的应用程序与其他应用程序的相似度较高,而表现特殊的应用程序与其他应用程序的相似度较低,能够根据相似度从海量应用程序中筛选出表现比较特殊的应用程序,由于多个参数全面地反映了应用程序的安装和使用情况,因此,解决了现有技术中使用单一参数筛选应用程序的准确度低的技术问题,达到了筛选应用程序的准确度高的技术效果。进一步地,在计算相似度的过程中既有应用程序自身不同周期的纵向对比,又有应用程序与其他应用程序的横向对比,使得筛选应用程序的准确度高。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

根据本发明实施例,还提供了用于实施上述应用程序的筛选方法的应用程序的筛选装置,该应用程序的筛选装置主要用于执行本发明实施例上述内容所提供的应用程序的筛选方法,以下对本发明实施例所提供的应用程序的筛选装置做具体介绍:

图6是根据本发明实施例的应用程序的筛选装置的示意图,如图6所示,该应用程序的筛选装置主要包括获取单元10和第一筛选单元20。

获取单元10,用于获取N个应用程序的第一参数和第二参数,其中,第一参数是用于表示应用程序的装机量的参数,第二参数是用于表示应用程序的用户的活跃程度的参数。

第一筛选单元20,用于根据第一参数和第二参数从N个应用程序中筛选出目标应用程序。

可选地,第一参数包括当前周期应用程序的装机量变化率和/或上个周期应用程序的装机量变化率。第一筛选单元20包括第一筛选子单元。第一筛选子单元,用于根据第二参数以及当前周期应用程序的装机量变化率和/或上个周期应用程序的装机量变化率从N个应用程序中筛选出目标应用程序。

可选地,第二参数包括至少一个子参数,第一筛选单元20包括第二筛选子单元。第二筛选子单元,用于根据至少一个子参数和第一参数从N个应用程序中筛选出目标应用程序,其中,子参数包括以下任意一个:当前周期应用程序的第一用户数量的变化率、上个周期应用程序的第一用户数量的变化率、当前周期应用程序总使用次数的变化率、上个周期应用程序总使用次数的变化率、当前周期应用程序总使用时长的变化率、上个周期应用程序总使用时长的变化率,其中,第一用户为使用过应用程序的用户。

可选地,第一筛选单元20包括获取子单元、第三筛选子单元和确定子单元。获取子单元,用于根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的相似度。第三筛选子单元,用于筛选出相似度满足预设条件的应用程序。确定子单元,用于将筛选出的应用程序作为目标应用程序。

可选地,获取子单元包括获取模块。获取模块,用于根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的距离参数,其中,距离参数用于表示每个应用程序与其他应用程序之间的相似程度。第三筛选子单元包括第一筛选模块。第一筛选模块,用于筛选出距离参数大于预设距离的应用程序。

可选地,获取子单元包括第一聚类模块。第一聚类模块,用于根据第一参数和第二参数将N个应用程序进行聚类,得到至少两个类别。第三筛选子单元包括第二筛选模块。第二筛选模块,用于筛选出第一应用程序,其中,第一应用程序偏离第一应用程序所在类别的中心的程度大于第一预设数值。

可选地,获取子单元包括第二聚类模块。第二聚类模块,用于根据第一参数和第二参数将N个应用程序进行聚类,得到至少两个类别,其中,每个类别中的应用程序周围的应用程序的稠密程度在预设范围内。第三筛选子单元包括第三筛选模块。第三筛选模块,用于筛选出处于至少两个类别以外的应用程序。

可选地,装置还包括第二筛选单元、确定单元。第二筛选单元,用于在确定子单元将筛选出的应用程序作为目标应用程序之后,在至少两个类别中筛选出目标类别,其中,目标类别中包含的应用程序的数量小于或者等于第二预设数值。确定单元,用于将目标类别中所有的应用程序也作为目标应用程序。

可选地,装置还包括过滤单元。过滤单元,用于在获取子单元根据第一参数和第二参数获取N个应用程序中每个应用程序与N个应用程序中的其他应用程序的相似度之前,过滤掉N个应用程序中用户数量小于第三预设数值的应用程序。

根据本发明实施例,还提供了一种应用程序的筛选系统,包括:上述应用程序的筛选装置。

根据本发明实施例,还提供了一种应用程序的筛选系统,包括:终端和服务器。终端,用于将N个应用程序的安装情况和使用情况上报给服务器。服务器,与终端通信连接,用于接收终端上报的N个应用程序的安装情况和使用情况,并根据安装情况和使用情况获取N个应用程序的第一参数和第二参数,并且根据第一参数和第二参数从N个应用程序中筛选出目标应用程序,其中,第一参数是用于表示应用程序的装机量的参数,第二参数是用于表示应用程序的用户的活跃程度的参数。

根据本发明实施例,还提供了一种用于实施上述应用程序的筛选方法的服务器,如图7所示,该服务器主要包括处理器701、显示器703、数据接口704、存储器705和网络接口706,其中:

数据接口704则主要通过数据传输的方式将传输给处理器701。

存储器705主要用于存储第一参数、第二参数、相似度、应用程序的标识等。

网络接口706主要用于与服务器进行网络通信。

显示器703主要用于显示第一参数、第二参数、相似度以及目标应用程序。

处理器701主要用于执行如下操作:

获取N个应用程序的第一参数和第二参数,其中,所述第一参数是用于表示所述应用程序的装机量的参数,所述第二参数是用于表示所述应用程序的用户的活跃程度的参数;根据所述第一参数和所述第二参数从所述N个应用程序中筛选出目标应用程序。

处理器701还用于执行:根据所述第二参数以及所述当前周期所述应用程序的装机量变化率和/或上个周期所述应用程序的装机量变化率从所述N个应用程序中筛选出目标应用程序。

处理器701还用于执行:根据所述至少一个子参数和所述第一参数从所述N个应用程序中筛选出目标应用程序,其中,所述子参数包括以下任意一个:当前周期所述应用程序的第一用户数量的变化率、上个周期所述应用程序的第一用户数量的变化率、当前周期所述应用程序总使用次数的变化率、上个周期所述应用程序总使用次数的变化率、当前周期所述应用程序总使用时长的变化率、上个周期所述应用程序总使用时长的变化率,其中,所述第一用户为使用过所述应用程序的用户。

处理器701还用于执行:根据所述第一参数和所述第二参数获取所述N个应用程序中每个应用程序与所述N个应用程序中的其他应用程序的相似度;筛选出所述相似度满足预设条件的应用程序;将筛选出的应用程序作为目标应用程序。

处理器701还用于执行:根据所述第一参数和所述第二参数获取所述N个应用程序中每个应用程序与所述N个应用程序中的其他应用程序的距离参数,其中,所述距离参数用于表示每个应用程序与其他应用程序之间的相似程度,筛选出所述距离参数大于预设距离的应用程序。

处理器701还用于执行:根据所述第一参数和所述第二参数将所述N个应用程序进行聚类,得到至少两个类别,筛选出第一应用程序,其中,所述第一应用程序偏离所述第一应用程序所在类别的中心的程度大于第一预设数值。

处理器701还用于执行:根据所述第一参数和所述第二参数将所述N个应用程序进行聚类,得到至少两个类别,其中,每个类别中的应用程序周围的应用程序的稠密程度在预设范围内;筛选出处于所述至少两个类别以外的应用程序。

处理器701还用于执行:在所述至少两个类别中筛选出目标类别,其中,所述目标类别中包含的应用程序的数量小于或者等于第二预设数值;将所述目标类别中所有的所述应用程序也作为所述目标应用程序。

处理器701还用于执行:过滤掉所述N个应用程序中用户数量小于第三预设数值的应用程序。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于存储本发明实施例的应用程序的筛选方法的程序代码。

可选地,在本实施例中,上述存储介质可以位于移动通信网络、广域网、城域网或局域网的网络中的多个网络设备中的至少一个网络设备。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:

S1,获取N个应用程序的第一参数和第二参数,其中,所述第一参数是用于表示所述应用程序的装机量的参数,所述第二参数是用于表示所述应用程序的用户的活跃程度的参数;

S2,根据所述第一参数和所述第二参数从所述N个应用程序中筛选出目标应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述第二参数以及所述当前周期所述应用程序的装机量变化率和/或上个周期所述应用程序的装机量变化率从所述N个应用程序中筛选出目标应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述至少一个子参数和所述第一参数从所述N个应用程序中筛选出目标应用程序,其中,所述子参数包括以下任意一个:当前周期所述应用程序的第一用户数量的变化率、上个周期所述应用程序的第一用户数量的变化率、当前周期所述应用程序总使用次数的变化率、上个周期所述应用程序总使用次数的变化率、当前周期所述应用程序总使用时长的变化率、上个周期所述应用程序总使用时长的变化率,其中,所述第一用户为使用过所述应用程序的用户。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述第一参数和所述第二参数获取所述N个应用程序中每个应用程序与所述N个应用程序中的其他应用程序的相似度;筛选出所述相似度满足预设条件的应用程序;将筛选出的应用程序作为目标应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述第一参数和所述第二参数获取所述N个应用程序中每个应用程序与所述N个应用程序中的其他应用程序的距离参数,其中,所述距离参数用于表示每个应用程序与其他应用程序之间的相似程度,筛选出所述距离参数大于预设距离的应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述第一参数和所述第二参数将所述N个应用程序进行聚类,得到至少两个类别,筛选出第一应用程序,其中,所述第一应用程序偏离所述第一应用程序所在类别的中心的程度大于第一预设数值。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据所述第一参数和所述第二参数将所述N个应用程序进行聚类,得到至少两个类别,其中,每个类别中的应用程序周围的应用程序的稠密程度在预设范围内;筛选出处于所述至少两个类别以外的应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:在所述至少两个类别中筛选出目标类别,其中,所述目标类别中包含的应用程序的数量小于或者等于第二预设数值;将所述目标类别中所有的所述应用程序也作为所述目标应用程序。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:过滤掉所述N个应用程序中用户数量小于第三预设数值的应用程序。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1