本发明涉及数据挖掘,尤其涉及一种应用标签体系构建方法、应用标签提取方法、介质及终端。
背景技术:
1、智能手机的使用逐渐占据人们日常生活越来越多的时间,手机应用程序逐渐在人们的现代生活中成为密不可分的一部分。现如今,每日新增的应用程序呈现出爆炸式的增长,如此海量的应用程序如何匹配到合适的用户成为一个新的问题。各大应用商店在应用程序推出的时候会根据归属的类目导航进行分类,这个成为应用程序的标签。这类标签能够为新用户匹配提供极大的帮助。
2、目前而言,各大应用市场上只有极少的平台能够提供标签功能,且仅限于热门的几万款应用而已,并且都是通过人工标注完成,虽然由人工的方法对标签类型标注比较灵活,但是效率方面显然无法满足现在的应用量。现有应用标签提取技术都是基于传统的关键词提取算法,比如tfidf,text-rank和隐含主题模型(lda)等等,基于提取规则主要分为四类,第一是基于规则及统计量的关键词提取,第二是基于模型的关键词提取,第三是基于主题模型的关键词提取,第四是基于函数映射的关键词提取方法。但传统的关键词提取算法提取的标签较为混乱,无法准确对应用进行标注,并且需要大量人工审核,耗费人力资源。
技术实现思路
1、本发明实施例提供了一种应用标签体系构建方法、应用标签提取方法、介质及终端,基于应用介绍数据和评论数据,将传统关键词提取算法和最新关键词提取算法相结合,自动化提取应用的标签,不仅提高了准确率,还有效的节省了人力资源的投入。
2、第一方面,本发明实施例提供了一种应用标签体系构建方法,包括:
3、基于若干个应用,从每个应用的应用信息中获取每个应用的若干个关键词;所述应用信息包括应用介绍信息和应用评论信息;
4、确定k个预设标签,分别选取所有应用的若干个关键词中的nk个关键词作为每个预设标签对应的关键词,nk>0,且nk为整数,k=1、2、3…,且k为整数;
5、根据所有预设标签对应的关键词,构建应用标签体系。
6、第二方面,本发明实施例提供了一种应用标签提取方法,包括:
7、根据目标应用的应用信息,利用预设模型获取目标应用的若干个关键词;所述应用信息包括应用介绍信息和应用评论信息;
8、将所述目标应用的若干个关键词与应用标签体系进行匹配,获取所述目标应用的标签;其中,所述应用标签体系通过上述应用标签体系构建方法得到。
9、第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述第一个方面或第二方面所述的方法步骤。
10、第四方面,本发明实施例提供一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面或第二方面所述的方法步骤。
11、本发明实施例提供的应用标签体系构建方法、应用标签提取方法、介质及终端,具备以下技术效果:
12、本发明基于若干个应用,从每个应用的应用信息中获取每个应用的若干个关键词;所述应用信息包括应用介绍信息和应用评论信息;确定k个预设标签,分别选取所有应用的若干个关键词中的nk个关键词作为每个预设标签对应的关键词,nk>0,且nk为整数,k=1、2、3…,且k为整数;根据所有预设标签对应的关键词,构建应用标签体系。本发明基于应用介绍数据和评论数据,将传统关键词提取算法和最新关键词提取算法相结合,通过将应用的关键词与应用标签体系进行匹配,自动化提取应用的标签,不仅提高了准确率,还有效的节省了人力资源的投入。
1.一种应用标签体系构建方法,其特征在于,包括:
2.根据权利要求1所述方法,其特征在于,所述基于若干个应用,从每个应用的应用信息中获取每个应用的若干个关键词;所述应用信息包括应用介绍信息和应用评论信息之前,还包括:
3.根据权利要求1或2所述方法,其特征在于,所述基于若干个应用,从每个应用的应用信息中获取每个应用的若干个关键词;所述应用信息包括应用介绍信息和应用评论信息,包括:
4.根据权利要求3所述方法,其特征在于,所述基于所述第一关键词、所述第二关键词,直至所述第m关键词及其对应的预设算法的分数,获取每个应用的若干个关键词,包括:
5.一种应用标签提取方法,其特征在于,包括:
6.根据权利要求5所述方法,其特征在于,所述利用预设模型获取目标应用的若干个关键词,包括:
7.根据权利要求6所述方法,其特征在于,所述将所述目标应用的若干个关键词与应用标签体系进行匹配,获取所述目标应用的标签,包括:
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述方法或如权利要求5至7中任一项所述方法。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述方法或如权利要求5至7中任一项所述方法。