一种pkg簇的获取方法、计算机设备及存储介质与流程

文档序号:31458602发布日期:2022-09-07 15:20阅读:104来源:国知局
一种pkg簇的获取方法、计算机设备及存储介质与流程

1.本发明涉及pkg处理技术领域,尤其涉及一种pkg簇的获取方法、计算机设备及存储介质。


背景技术:

2.随着普及电子设备的应用,每一电子设备涉及信息安全问题,在当前的网络环境下,信息安全越来越受到重视。当前,大部分电子设备安装了大量app,这些app多少用于生活或者工作等场景的使用,因此每个app都涉及到信息,进而会产生泄露信息或者恶意传播信息等恶意行为影响到信息安全,尤其是在安装app时必然存在安装包配置文件,简称pkg文件,pkg文件是获取信息的源头之一,但是现有技术中,对于信息安全的技术方案均是通过多信息加密或者多信息传输过程中加密,很少有技术方案涉及提高pkg文件信息的安全性,因此,导致pkg文件信息的泄露或者恶意传播,影响到电子设备的信息安全。


技术实现要素:

3.针对上述技术问题,本发明采用的技术方案为一种pkg簇的获取方法,所述方法:
4.s100、根据初始pkg列表和初始pkg列表中每一初始pkg对应的初始标签列表,获取第一样本pkg列表和第二样本pkg列表;
5.s200、对第一样本pkg列表进行处理,获取第一样本pkg列表对应的中间pkg集g={g1,
……
,gj,
……
,gn},gj是指第j类目标标签对应的中间pkg列表,j=1
……
n,n为目标标签的类型数量;
6.s300、对每一gj进行处理,获取到g对应的中间pkg簇列表h={h1,
……
,hr,
……
,hs},hr是指第r个中间pkg簇,r=1
……
s,s为中间pkg簇的数量;其中,在s300步骤中还包括如下步骤:
7.s301、对每一gj进行聚类处理,获取g对应的第一指定pkg簇集h'={h'1,
……
,h'j,
……
,h'n},h'j={h'
j1

……
,h'
ja

……
,h'
jbj
},h'
ja
是指gj对应的第a个第一指定pkg簇,a=1
……
bj,bj为gj对应的第一指定pkg簇的数量;
8.s303、根据h'
ja
与h'
ja
对应的非第一指定pkg簇列表,获取中间pkg簇。
9.本发明保护了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的pkg簇的获取方法。
10.本发明保护了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的pkg簇的获取方法。
11.本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种pkg簇的获取方法、计算机设备及存储介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
12.本发明提供了一种pkg簇的获取方法、计算机设备及存储介质,所述方法:根据初
始pkg列表和初始pkg列表中每一初始pkg对应的初始标签列表,获取第一样本pkg列表和第二样本pkg列表;对第一样本pkg列表进行处理,获取第一样本pkg列表对应的中间pkg集;对每一中间pkg列表进行处理,获取到中间pkg列表对应的中间pkg簇列表,其中,具体步骤为:对每一中间pkg列表进行聚类处理,获取中间pkg列表对应的第一指定pkg簇列表;根据第一指定pkg簇列表中第一指定pkg簇与第一指定pkg簇对应的非第一指定pkg簇列表,获取中间pkg簇;可知,通过每一目标标签类型中的pkg进行聚类后,再整体进行聚类,保证了聚类的准确性,进而通过聚类生成pkg簇,使得将目标pkg簇发送至用户,实现对pkg的模糊化,提高pkg文件信息的安全性。
13.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
14.图1为本发明实施例提供的一种pkg簇的获取方法的流程图;
15.图2为本发明实施例提供的s300步骤的流程图。
具体实施方式
16.为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
17.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
18.实施例一
19.如图1所示,本实施例提供了一种pkg簇的获取方法,包括如下步骤:
20.s100、根据初始pkg列表和初始pkg列表中每一初始pkg对应的初始标签列表,获取第一样本pkg列表和第二样本pkg列表。
21.具体地,在s100步骤中还通过如下步骤确定第一样本pkg和第二样本pkg:
22.s101、获取初始pkg列表a={a1,
……
,ai,
……
,am},ai是指第i个初始pkg,i=1
……
m,m为初始pkg数量。
23.进一步地,在a中所有的初始pkg对应同一应用平台,避免因不同应用平台导致的同一pkg具有不同的标签,导致无法准确的样本pkg聚类的情况。
24.s103、根据ai,获取ai对应的初始标签列表。
25.s105、当ai对应的初始标签列表不等于null时,将ai作为第一样本pkg,即第一样本pkg为有标签的pkg。
26.s107、当ai对应的初始标签列表等于null时,将ai作为第二样本pkg,即第二样本pkg为无标签的pkg。
27.优选地,本领域技术人员知晓,基于第一样本pkg构建成第一样本pkg列表的方法和基于第二样本pkg构建成第二样本pkg列表的方法,在此不再赘述;基于上述方法获取到可知第一样本pkg列表和第二样本pkg列表,可知,能够将有标签的和无标签的pkg区分出,便于后续跟进有标签的pkg构建pkg簇,在将无标签的pkg插入已知的pkg簇中,实现对大量的pkg模糊化。
28.s200、对第一样本pkg列表进行处理,获取第一样本pkg列表对应的中间pkg集g={g1,
……
,gj,
……
,gn},gj是指第j类目标标签对应的中间pkg列表,j=1
……
n,n为目标标签的类型数量。
29.具体地,在s200步骤中还包括如下步骤:
30.s201、获取第一样本pkg列表中任一第一样本pkg对应的标签列表l={l1,
……
,l
t

……
,lk},l
t
是指第一样本pkg对应的第t个初始标签,t=1
……
k,k为指第一样本pkg对应的初始标签的数量;
31.s203、基于从所述应用平台中获取l
t
对应的pkg数量,获取l对应的pkg数量列表;
32.s205、遍历l对应的pkg数量列表且从l对应的pkg数量列表中获取最大pkg数量对应的初始标签作为第一样本pkg的目标标签;
33.s207、根据所有第一样本pkg的目标标签,获取到g。
34.上述,通过同一应用平台中任一标签的pkg数量,确定出第一样本pkg的目标标签,能够将pkg根据标签进行分类,以使得对每一分类后的pkg列表进行聚类处理,得到pkg簇。
35.在另一个具体的实施例中,在s200步骤中或包括如下步骤:
36.s201、获取第一样本pkg列表中任一第一样本pkg对应的标签列表l={l1,
……
,l
t

……
,lk},l
t
是指第一样本pkg对应的第t个初始标签,t=1
……
k,k为指第一样本pkg对应的初始标签的数量;
37.s203、基于从所有的应用平台中获取l
t
对应的pkg数量,获取l对应的pkg数量列表;
38.s205、遍历l对应的pkg数量列表且从l对应的pkg数量列表中获取最大pkg数量对应的初始标签作为第一样本pkg的目标标签;
39.s207、根据所有第一样本pkg的目标标签,获取到g。
40.上述,通过不同的应用平台中同一标签的pkg数量,确定出第一样本pkg的目标标签,相对于基于同一应用平台,确定出第一样本pkg的目标标签,本实施例能够更加准确的确定出目标标签,避免因应用平台自身获取的某一标签对应的pkg数量过大,导致无法准确的确定出目标标签。
41.s300、对每一gj进行处理,获取到g对应的中间pkg簇列表h={h1,
……
,hr,
……
,hs},hr是指第r个中间pkg簇,r=1
……
s,s为中间pkg簇的数量。
42.如图2所示,在s300步骤中还包括如下步骤:
43.s301、对每一gj进行聚类处理,获取g对应的第一指定pkg簇集h'={h'1,
……
,h'j,
……
,h'n},h'j={h'
j1

……
,h'
ja

……
,h'
jbj
},h'
ja
是指gj对应的第a个第一指定pkg簇,a=1
……
bj,bj为gj对应的第一指定pkg簇的数量。
44.具体地,在s301步骤中还包括如下步骤:
45.s3011、获取gj对应的向量列表g'j={g'
j1

……
g'


……
g'

},g'

是指gj中第δ个中间pkg对应的向量,δ=1
……
η,η为gj内的中间pkg的数量。
46.s3012、获取gj对应的初始向量列表csj={cs
j1

……
,cs
ja

……
,cs
jbj
},cs
ja
是指gj对应的第a个初始向量。
47.进一步地,所述初始向量是gj中随机选取bj个向量。
48.s3013、根据g'

和csj,获取g'

对应的相似度列表f
δj
={f
δj1

……
,f
δja

……fδjb
},f
δja
是指g'

和cs
ja
之间的相似度;本领域技术人员知晓,任何获取向量之间的相似度的方法均属于本发明的保护范围;优选地,两个向量之间的相似度的获取方法为余弦相似度方法。
49.s3014、遍历f
δj
且将g'

与f
δj
中最大相似度对应的初始向量进行聚类成第三指定pkg簇。
50.s3015、重复执行s3014步骤,获取到gj对应的第三指定pkg簇列表。
51.s3016、根据gj对应的第三指定pkg簇列表,获取gj对应的第三指定pkg簇列表中每一第三指定pkg簇的均值向量,其中,所述均值向量是指每一pkg簇内的中心点对应的向量。
52.s3017、根据g'

与每一第三指定pkg簇的均值向量重新聚类,获取到第四指定pkg簇列表;
53.s3018,重复执行s3016和s3017步骤,直到最终的指定pkg簇列表的均值向量不变且将最终的指定pkg簇列表作为h'j。
54.s303、根据h'
ja
与h'
ja
对应的非第一指定pkg簇列表,获取中间pkg簇。
55.具体地,在s303步骤中还包括如下步骤:
56.s3031、获取h'对应的均值向量列表h0={h
01

……
,h


……
,h

},h

是指h'对应的第σ个第一指定pkg簇的均值向量,σ=1
……
μ,μ为第一指定pkg簇的数量。
57.s3033、获取h'
ja
对应的向量列表,其中,h'
ja
对应的向量列表中包括若干个pkg对应的向量。
58.s3035、根据h0,h'
ja
对应的非第一指定pkg簇列表,其中,非第一指定pkg簇列表是指h0中除h'
ja
对应均值向量之外的所有第一指定pkg簇的均值向量,构建的数据列表。
59.s3037、根据h'
ja
对应的非第一指定pkg簇列表和h'
ja
对应的向量列表,获取到h。
60.进一步地,s3037步骤可以参照s3013-s3018步骤,在此不再赘述。
61.上述,通过每一目标标签类型中的pkg进行聚类后,再整体进行聚类,保证了聚类的准确性,进而通过聚类生成pkg簇,使得将目标pkg簇发送至用,实现对pkg的模糊化,提高pkg文件信息的安全性。
62.s400、当hr对应的pkg数量等于第一pkg数量阈值时,则将hr插入至第二样本pkg列表中,生成第三样本pkg列表。
63.具体地,所述第一pkg数量阈值为1;进一步理解为:第三样本pkg列表是指将孤立的pkg插入至第二样本pkg列表中后的pkg列表。
64.s500、当hr对应的pkg数量不等于第一pkg数量阈值时,则将hr对应的pkg数量与第二pkg数量阈值进行比对。
65.具体地,所述第二pkg数量阈值的取值范围为3~5。
66.s600、当hr对应的pkg数量不小于第二pkg数量阈值时,则将hr作为目标pkg簇;
67.s700、当hr对应的pkg数量小于第二pkg数量阈值时,根据hr和第三样本pkg列表。
68.具体地,在s700步骤中还包括如下步骤:
69.s701、当hr对应的pkg数量小于第二pkg数量阈值时,将hr作为第一pkg簇且基于第一pkg簇,构建第一pkg簇列表u={u1,
……
,ug,
……
,uz},ug是指第g个第一pkg簇,g=1
……
z,z为关键pkg簇的数量;
70.s703、获取第三样本pkg列表d={d1,
……
,d
x

……
,dq},d
x
是指第x个第三样本pkg,x=2
……
q,q为第三样本pkg的数量;
71.s705、从u中获取d
x
对应的第二pkg簇列表u'
x
={u'
x1

……
,u'
xy

……
,u'
xp
},u'
xy
是指d
x
对应的第y个第二pkg簇,y=2
……
p,p为d
x
对应的第二pkg簇的数量。
72.具体地,在s705步骤中还包括如下步骤:
73.s7051、获取d
x-1
对应的第二pkg簇列表u'
x-1

74.进一步地,当x=2时,u'1=u。
75.s7053、根据d
x-1
和u'
x-1
,获取d
x-1
对应的相似度列表f
x-1

76.进一步地,f
x-1
的获取方式与f
x
的获取方式一致,在此不再赘述。
77.s7055、遍历f
x-1
且将d
x-1
插入至f
x-1
中最大相似度对应的第二pkg簇,获取d
x-1
对应的第三pkg簇。
78.在另一个具体的实施例中,当f
x-1
中最大相似度对应的第二pkg簇的数量大于1时,从所有的f
x-1
中最大相似度对应的第二pkg簇中任选一个第二pkg簇作为d
x-1
对应的第三pkg簇;能够满足多个最大相似度的情况下,选择一个pkg簇。
79.s7057、当d
x-1
对应的第三pkg簇内的pkg数量不小于第二pkg数量阈值时,确定d
x-1
对应的第三pkg簇作为目标pkg簇且将删除d
x-1
对应的第三pkg簇的u'
x-1
作为u'
x
;能够同时进行确定出目标pkg簇和u'
x

80.s7059、当d
x-1
对应的第三pkg簇内的pkg数量小于第二pkg数量阈值时,将d
x-1
对应的第三pkg簇保留在u'
x-1
内且将u'
x-1
作为u'
x

81.s707、根据d
x
和u'
x
,获取d
x
对应的相似度列表f
x
={f
x1

……
,f
xy

……
,f
xp
},f
xy
是指d
x
与u'
xy
之间的相似度。
82.具体地,在s707步骤中,f
xy
符合如下条件:
83.其中,mk
γx
是指d
x
对应的向量中第γ个bit值,nk
γxy
是指u'
xy
对应的目标向量中第γ个bit值,对应的目标向量中第γ个bit值,为pkg对应的向量的bit位数。
84.优选地,通过word2vec模型,获取到pkg对应的向量,即
85.s709、根据f
xy
,获取到目标pkg簇。
86.具体地,在s709步骤中还包括如下步骤:
87.s7091、遍历f
x
且将d
x
插入至f
x
中最大相似度f
xy
对应的关键pkg簇,获取d
x
对应的第三pkg簇;
88.s7093、当d
x
对应的第三pkg簇内的pkg数量不小于第二pkg数量阈值时,确定d
x
对应的第三pkg簇作为目标pkg簇。
89.具体地,所述目标向量是指中间pkg簇内所有pkg对应的向量的均值向量;优选地,当第三样本pkg列表中任一pkg插入第一pkg簇时,保持所述中间pkg簇对应的目标向量不变,其中,第一pkg簇∈中间pkg簇,能够实现避免孤立的pkg或者无标签的pkg对pkg簇的中心点进行改变,使得pkg簇的中心点偏移,进而影响到pkg簇的准确性。
90.进一步的,本领域技术人员知晓,从h中获取u'
xy
对应的目标向量的方法,在此不再赘述。
91.具体地,当所述计算机程序被处理器执行时,实现还以下步骤:将目标pkg簇反馈至用户,以实现pkg的模糊化。
92.本实施例提供了一种获取pkg簇的数据处理系统,所述系统包括:初始pkg列表、初始pkg列表中每一初始pkg对应的初始标签列表、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据初始pkg列表和初始pkg列表中每一初始pkg对应的初始标签列表,获取第一样本pkg列表和第二样本pkg列表;对第一样本pkg列表进行处理,获取第一样本pkg列表对应的中间pkg集;对中间pkg集内目标标签对应的pkg列表进行聚类处理,获取到中间pkg簇列表;当任一中间pkg簇对应的pkg数量等于第一pkg数量阈值时,则将中间pkg簇插入至第二样本pkg列表中,生成第三样本pkg列表;当任一中间pkg簇对应的pkg数量不等于第一pkg数量阈值且当任一中间pkg簇对应的pkg数量不小于第二pkg数量阈值时,则将中间pkg簇作为目标pkg簇;当任一中间pkg簇对应的pkg数量小于第二pkg数量阈值时,根据中间pkg簇和第三样本pkg列表,获取目标pkg簇;可知,能够根据无标签的pkg和有标签的pkg通过聚类的方式,获取到目标pkg簇,以将目标pkg簇发送至用,实现对pkg的模糊化,提高pkg文件信息的安全性。
93.另一实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例的pkg簇的获取方法。
94.另一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例的pkg簇的获取方法。
95.以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1