一种基于众包的安卓应用演化推荐方法
【技术领域】
[0001] 本发明属于软件维护领域,特别涉及一种基于众包的安卓应用演化推荐方法。
【背景技术】
[0002] Android系统的开放性使其在很短的时间内迅速发展,成为全球市场占有率首位 的智能移动终端操作系统。它的使用涵盖了智能手机、平板电脑、电视机顶盒以及其他嵌入 式便携电子设备。随之而来的是App的迅速发展,近年来,Android市场的App以一种不可控 制的速度增长着,用户对于高质量的App的需求也不断增加,而且Android应用的演化和升 级速度比传统的软件来的更快,开发者如何能够满足广大用户的需求,仅仅依靠开发团队 的创新,或者基于代码本身的结构改进,已经不能在App市场中脱颖而出,为此,如何从市场 和用户的角度提供更高效的修改推荐,来帮助开发者及时修改以及发布新的版本是每个 Andr 〇 i d应用开发商比较关心的问题。
[0003] 在本发明作出之前,已经有的推荐方法如基于用户的协同过滤技术(CF),基于评 估分数的矩阵分解推荐技术(GEFM)等,类似于这样推荐的技术有的只考虑了单个因素,有 的考虑的因素不全面。例如CF技术没有考虑到地理信息,他的思想只是根据相似性进行推 荐,最终还是会蜕变成搜索算法。GEFM技术最佳但是推荐仍没有考虑到交互性,它是一种对 传统的矩阵分解的SVD方法的一种优化,效果好但是仍然没有考虑交互性,在App更新发展 的过程中,用户与产品的交互如果缺少考虑,我们更新后的产品再应用到用户中的效果将 大大降低。
【发明内容】
[0004] 本发明的目的就在于克服上述缺陷,研制一种基于众包的安卓应用演化推荐方 法。
[0005] 本发明的技术方案是:
[0006] -种基于众包的安卓应用演化推荐方法,其步骤在于:
[0007] 步骤1)首先从移动应用市场的某个Android应用中提取用户对该应用的评论,然 后基于AR-MINER工具,过滤无用的评论,得到有用的用户评论集;
[0008] 步骤2)使用自然语言预处理技术对有用的用户评论中的词语进行预处理,去除一 些无用的词语;
[0009] 步骤3)基于情感-方面-地区模型,对评论中的情感,方面,地区进行分析,得到关 于用户感情,方面以及地区的有效评论的特征诉求;
[0010] 步骤4)提取多数用户对App的特征诉求,根据步骤3)中获得的有效的评论特征诉 求,计算特征诉求中关键字出现的频率并进行概率计算,找出其中多数人评论中关心的特 征以及要求;
[0011] 步骤5)针对与当前APP同类的其他App,根据同类App的特征描述进行分析,利用 LDA主题模型产生特征关键字,通过计算其关键字的出现频率值,找出多数App共有的特征;
[0012]步骤6)排序,综合情感,方面,地区,多数用户对App的特征诉求,利用SAR模型的概 率值以及特征出现频率概率值,结合Top-n在线推荐算法推荐出η个最优的修改意见;进行 同类App推荐时,通过同类App的特征关键字根据步骤5)中特征关键字概率进行排序推荐。
[0013] 其特征在于步骤1)中,通过爬取应用商店里面我们所需要修改的App的所有评论, 基于AR-MINER工具,检索出所有有用的评论。
[0014] 其特征在于步骤2)中使用NLP技术的预处理过程:
[0015] a)托肯化:去除标点符号,去除数字;
[0016] b)去除停用词、连词、修饰词。
[0017] 其特征在于步骤3)中对于用户评论中情感,地区,特征的提取:
[0018] a)情感:通过预定义的情感集,语义分析器判断出句子的极性,语义分析器包括预 先定义的一些关于情感的词语,极性分为good和not good两种,这里主要取包含not good 情感的评论;
[0019] b)地区:通过基于坐标的K-means算法,通过聚类过程得出评论中的用户地理位 置,取出这些用户需求的地理位置;
[0020] c)方面:通过基于句子层次的K-means算法,给每个句子一个相关的方面,最后获 取所有评论中的用户对于信息点的感受。
[0021] 其特征在于步骤4)中获取多数用户对App的特征诉求,通过计算步骤3)中关键字 出现的频率:
[0023] 其特征在于步骤5)提取同类App的特征:通过对同类App的特征描述进行LDA主题 分析,LDA是用来挖掘语义的,提取主题的一个模型并给每个描述的句子一个主题,并且通 过分析大多数同类App的特征,通过公式计算其特征关键字出现的概率,推荐时我们根据其 频率大小进行排序推荐,
[0025]其特征在于步骤6)的排序:若开发者选择从用户评论进行排序,综合情感,方面, 地区,多数用户对App的特征诉求,将情感-方面-地区模型中的推荐概率计算和关键字出现 频率计算以及同类App的特征概率结合起来:
[0026] pi指SAR模型的推荐概率:
[0028]即表示用户u在情感,方面,地区这三方面不喜欢APP t的概率;其中,t,s_,u,r,a, ct分别代表APP,负面情感,用户,地区,APP的方面以及APP的种类;
[0029] p2指关键字出现频率:
[0031]最终我们根据线性关系相结合:
[0032] ρ = αρ1+βρ2
[0033] (<1,0是输入参数权重)。
[0034] 本发明的优点和效果在于提出了一种基于Android应用生态系统演化的App维护 推荐模型,可以向Android开发者作出关于App修改分析的有效推荐,提高APP应用演化的质 量和效率。主要有以下一些优点:
[0035] (1)考虑了情感的因素,我们从用户情感出发,目前的推荐修改技术很多,但是还 没有从用户情感出发的,本发明从用户情感出发,会更加贴近用户的真实感受。
[0036] (2)考虑了地区的因素,地区在App发展中也起到可观的作用,而这一因素常常被 人忽视,因此我们的技术扣住了地区,更加高效分析了App评论。
[0037] (3)考虑了市场的因素,App最终的发展状况是根据市场情况来判断的,因此我们 的技术提取了市场中同类软件的用户评论,这样的推荐可更好地保障APP保持市场竞争力。
【附图说明】
[0038]图1--本发明的总体流程不意图。
[0039]图2-一提取的部分用户评论示意图。
[0040] 图3--AR-MINER过滤后的用户评论示意图。
[0041 ]图4一一过滤后的评论初始化后的结果示意图。
[0042]图5-一SAR分析过后的评论示意图。
[0043]图6 同类App的特征提取不意图。
[0044]图7-一根据用户评论排序后推荐的结果示意图。
[0045]图8-一本发明根据同类App特征排序后推荐的结果示意图。
【具体实施方式】
[0046]本发明的技术思路是:
[0047] 本发明提出user-review-app-developer,即从用户出发,研究用户的评论,应用 到app本身中去,推荐给开发者进行修改。我们从用户情感,方面,地区出发,考虑用户的因 素;另外,也考虑同类型软件的功能和评论,考虑了市场的因素。这种综合各个方面的分析 更有利于促进开发者高效率更新,充分利用了用户评论的价值和市场的价值。
[0048]下面根据附图进一步说明本发明。
[0049] 步骤1)我们首先从移动应用市场的Android应用中提取用户对该应用的评论,然 后基于AR-MINER工具,将评论分为有用和无用的两类,我们主要选择有用的评论。我们此处 所举的例子为"知乎",在图(2)中,比如我们提取的两个评论,"经常一刷就是一晚上啊"和 "什么鬼啊",AR-MINER将会过滤掉这两个评论,而像"虚拟键盘去掉就好了"和"不知道為什 麽個人簡介無法改性别"这两个评论,我们将会保留。最