一种基于问卷调查的个体认知安全意识评估方法

文档序号:28164914发布日期:2021-12-24 21:57阅读:130来源:国知局
一种基于问卷调查的个体认知安全意识评估方法

1.本发明属于网络空间安全/社会工程学/心理测量学领域,具体涉及一种基于问卷调查的个体认知安全意识评估方法。


背景技术:

2.随着互联网的广泛普及与加速发展,计算机用户对网络的依赖与交互日益增强,社会工程学作为一种以人为攻击目标的网络攻击手段技术也越来越成熟。网络攻击者通过与他人建立合理交流(如发邮件、设置钓鱼网站等),对受害者心理施加一定的影响以产生认知偏差,使得受害者做出攻击者希望的动作或行为,从而到达攻击者的攻击目的。
3.近年来社会工程学攻击呈现迅速上升甚至滥用的趋势,其攻击种类及形式繁多,攻击者常针对人的心理弱点以及认知缺陷设计社工攻击场景,因此攻击效果往往在攻击目标间存在较大的差异化。
4.由于社会工程学攻击的特殊性,社会工程学攻击的检测研究可根据出发点分为基于主体和基于技术两个方面。但社工攻击成本低、攻击风险小、攻击方法与模式更新快以及鱼叉式攻击等针对性攻击不断发展,基于技术的防御手段效果有限,个体网络安全意识已成为基于主体防范社工攻击的关键。


技术实现要素:

5.针对现有技术中存在的问题,本发明提出了一种基于问卷调查的个体认知安全意识评估方法,可有效评估个体用户网络安全相关的认知结构与认知水平,为基于主体防范社工攻击的防御手段及用户网络安全意识培训提供了基础。
6.所述的基于问卷调查的个体认知安全意识评估方法,具体步骤如下:
7.步骤一、构造包含基础知识、计算机知识、行为偏好、网络安全意识、认知心理、认知风格和认知反应七个方面题目的问卷;
8.步骤二、对问卷进行内在信度和外在信度的计算,分析评判问卷的合理性和正确性;
9.首先,使用cronbachα系数对问卷进行内在信度分析,其计算公式为:
[0010][0011]
其中,k为问卷中的题目数,为第j题得分的题内方差,是全部题总得分的方差,α取值范围为0

1。
[0012]
当α≥0.8表明问卷信度较高,问卷内容满足要求;当0.8>α≥0.7,表明问卷存在不合理之处,需对问卷进行修订;当α<0.6,则表明问卷完全不合理,需重新设计问卷;
[0013]
然后,选取若干用户试测,对其间隔半个月分别进行两次问卷试测,对两份问卷数据使用重测信度法进行外在信度分析,计算公式为:
[0014][0015]
其中r
xx
是重测信度,x是试测用户各题第一次测量的得分,是试测用户各题第一次测量的得分平均值,y是试测用户各题第二次测量的得分,是试测用户各题第二次测量得分的平均值,重测信度的取值范围在0

1之间。
[0016]
当r
xx
≥0.8表明问卷信度较高,问卷内容满足要求;当r
xx
<0.8,表明问卷存在不合理之处,需对问卷进行修订;
[0017]
结合内在信度和外在信度两项指标,修改至问卷内在信度α≥0.8且外在信度r
xx
≥0.8时,表明问卷设计合理,确定问卷最终内容。
[0018]
步骤三、针对合理正确的问卷,选取若干用户提取认知属性,分析并确定认知属性的层级关系和理想掌握模式;
[0019]
具体选取过程为:
[0020]
针对问卷内容,选取若干用户分别提取问卷中的认知属性,并对各用户提取的认知属性取并集,得到汇总后的认知属性候选集;针对候选集中的各认知属性,各用户再次投票确认,选择认同人数超过60%的认知属性作为最终的认知属性集;
[0021]
在认知属性集的基础由各用户进一步确定认知属性的层级关系,认知属性的层级关系包括:分支、线性、收敛以及无结构型;
[0022]
具体步骤如下:
[0023]
首先,构建认知属性集对应的关联矩阵,其行数和列数均与认知属性集中属性个数相当,其每行每列的元素对应一对属性有序对;
[0024]
其次,各用户对认知属性依赖关系进行两两判断:认知属性间具有有向依赖关系,将对应的元素设为1,将认知属性间不存在相关关系,其对应的元素设为0;
[0025]
然后,统计关联矩阵中1的元素个数,并判断是否大于用户个数的三分之一,如果是,将所有元素1对应的属性有序对进行有向连接,形成认知属性关联图;否则,不予处理;
[0026]
最后,检查认知属性关联图中是否含有环;如果有,则忽略环上的相关认知属性;从而完成认知属性层级关系的构建;否则,不予处理。
[0027]
将认知属性关联图中的每个子图分别作为一个理想掌握模式,根据属性间的层级关系计算各理想掌握模式的安全评分,计算公式为:
[0028]
v为认知属性关联图包含的认知属性个数,e为认知属性间的有向关联数;v为理想掌握模式对应的单个子图中包含的认知属性个数,e为理想掌握模式对应的单个子图中认知属性间的有向关联数。
[0029]
步骤四、各受试用户填写问卷数据,并进行预处理剔除数据中的异常值及空缺值;
[0030]
步骤五、将各受试用户的问卷答题结果映射到规则空间rsm模型中,获取与各用户答题情况最接近的3个理想掌握模式;
[0031]
rsm模型以各受试用户的能力水平θ为横轴,警戒指标ζ为纵轴构造规则空间;
[0032]
获取最接近的3个理想掌握模式过程为:
[0033]
首先,rsm模型将每个理想掌握模式都映射到一个规则点坐标每个受试用户的问卷答题结果都映射到实际反应坐标通过计算实际反应坐标与规则点坐标的两两距离进行归类。
[0034]
然后,将距离值按从小到大排序,并选择前3个距离值对应的理想掌握模式,与距离组成对组:((m1,d1),(m2,d2),(m3,d3))。
[0035]
步骤六、通过无监督聚类将认知属性关联图中所有理想掌握模式进行分类,并归纳出认知属性的安全等级;
[0036]
认知属性的安全等级分为好、较好、一般、较差和差五种等级;
[0037]
首先,采用deepwalk图表示算法对各理想掌握模式对应的子图进行嵌入表示:
[0038]
然后,设定类簇质心数为k=5;初始时在理想掌握模式的嵌入空间r
300
中随机选取五个类簇质心向量c
i
=(c
i,1
,c
i,2
,...,c
i,j
,...,c
i,300
),i=1,2,3,4,5;
[0039]
进一步,计算各理想掌握模式的嵌入表示向量与各类质心向量的欧氏距离,并将各理想掌握模式归入相距最近的类簇;
[0040]
距离计算公式如下:
[0041][0042]
其中x
j
为第j个理想掌握模型的嵌入表示;
[0043]
最后,根据分类结果重新计算类簇质心,迭代上述过程直至质心位置不再变动,得到五个类簇质心向量以及各理想掌握模式的归属类别;
[0044]
将各类中所有理想掌握模式的安全评分score求取平均值,并由高到低排序,依次对应认知安全意识好、较好、一般、较差和差五种等级的类簇质心向量,分别对应认知属性的5个安全等级。
[0045]
步骤七、将各用户最接近的3个理想掌握模式对应的距离值分别进行归一化,根据归一化结果加权平均,选择最接近的分数对应的等级作为该用户的认知安全意识安全评估的结果。
[0046]
归一化计算公式为:
[0047]
认知属性的5个安全等级对应分数为1

5分。
[0048]
本发明的优点在于:
[0049]
1.一种基于问卷调查的个体认知安全意识评估方法,将心理测量学中认知诊断理论引入网络安全意识的评估,提出了具体可操作的认知属性及层级关系的确定方法,具有更强的稳健性和合理性;
[0050]
2.一种基于问卷调查的个体认知安全意识评估方法,利用图表示算法针对用户的认知掌握模式进行嵌入表示,可充分捕捉用户的认知结构特征;
[0051]
3.一种基于问卷调查的个体认知安全意识评估方法,从认知结构和掌握模式层面进行无监督聚类,较之直接对用户测试结果聚类具有更直观的物理含义。
附图说明
[0052]
图1为本发明一种基于问卷调查的个体认知安全意识评估方法的原理图;
[0053]
图2为本发明一种基于问卷调查的个体认知安全意识评估方法的流程图。
具体实施方式
[0054]
下面将结合附图和实施示例对本发明作进一步的详细说明。
[0055]
本发明提出了一种基于问卷调查的个体认知安全意识评估方法,目的在于通过调查问卷与问卷数据分析的方式完成对个体安全认知的建模并进行等级评估。如图1所示,首先,构造包含基础知识、计算机知识、行为偏好、网络安全意识、认知心理、认知风格和认知反应七个方面题目的用户问卷,并进行预处理放入认知诊断模型中;同时,通过对问卷进行可信度的测试,认知属性的分析和属性关系的验证后,得到理想掌握模式;对理想掌握模式进行嵌入表示和无监督聚类,结合认知诊断模型计算各用户的安全评级,本方法使用心理测量学领域的认知诊断理论对调查问卷进行分析设计,利用无监督聚类算法归纳认知结构和模式的认知程度,实现用户认知安全意识的等级评估。
[0056]
所述的基于问卷调查的个体认知安全意识评估方法,如图2所示,具体步骤如下:
[0057]
步骤一、构造包含基础知识、计算机知识、行为偏好、网络安全意识、认知心理、认知风格和认知反应七个方面题目的问卷;
[0058]
步骤二、对问卷进行内在信度和外在信度的计算,分析评判问卷的合理性和正确性;
[0059]
信度是调研数据与项目评价数据可靠性的重要指标,反映调研数据的客观性;信度可分为内在信度和外在信度两方面,其中内存信度侧重于评估问卷结构的一致性,而外在信度侧重于测量问卷在不同时间得到结果的稳定程度。
[0060]
首先,使用cronbachα系数对问卷进行内在信度分析,其计算公式为:
[0061][0062]
其中,k为问卷中的题目数,为第j题得分的题内方差,是全部题总得分的方差,α取值范围为0

1。
[0063]
借助统计分析工具spss进行cronbachα系数的计算,当α≥0.8表明问卷信度较高,问卷内容满足要求;当0.8>α≥0.7,表明问卷存在不合理之处,需对问卷进行修订;当α<0.6,则表明问卷完全不合理,需重新设计问卷;
[0064]
然后,选取若干用户试测,使用重测信度法对问卷进行外在信度分析;
[0065]
具体为:抽取50名受试者间隔30天重复施测,分别进行两次问卷试测,并计算两次施测结果的pearson相关系数,对两份问卷数据使用重测信度法进行外在信度分析,计算公式为:
[0066][0067]
其中r
xx
是重测信度,x是试测用户各题第一次测量的得分,是试测用户各题第一
次测量的得分平均值,y是试测用户各题第二次测量的得分,是试测用户各题第二次测量得分的平均值,重测信度的取值范围在0

1之间。
[0068]
当r
xx
≥0.8表明问卷信度较高,问卷内容满足要求;当r
xx
<0.8,表明问卷存在不合理之处,需对问卷进行修订;
[0069]
重测信度属于稳定系数,适用于事实式设题,测试问卷跨时间的稳定性。
[0070]
结合内在信度和外在信度两项指标,修改至问卷内在信度α≥0.8且外在信度r
xx
≥0.8时,表明问卷设计合理,确定问卷最终内容。
[0071]
步骤三、针对合理正确的问卷涵盖的各方面内容进行分析,选取若干用户提取认知属性,分析并确定认知属性的层级关系和理想掌握模式;
[0072]
具体选取过程为:
[0073]
针对问卷内容,选取30名信息安全相关专业的大学教师、博士研究生和硕士研究生分别提取与网络安全相关的认知属性(例如蠕虫病毒的概念、木马的攻击原理、查看邮件时是否具有检查发件人信息的行为等),并对提取的认知属性取并集,得到汇总后的认知属性候选集;针对候选集中的各认知属性,师生再次投票确认,选择认同人数超过60%的认知属性作为最终的认知属性集;
[0074]
认知诊断一般指对个体认知过程、加工技能或知识结构的诊断,强调个体内部心理活动规律及加工机制。认知诊断不仅测试范围可以涵盖受试者的安全常识以及安全行为,同时强调其内部微观心理加工过程,在认知安全意识评估中有助于将受试者的理论水平与实际操作行为综合评估。
[0075]
认知属性作为认知诊断的基本单位,是指为了解决某一问题或完成某个任务所需要具备的程序性知识或陈述性知识的描述。通过对问卷中试题涵盖的知识进行分析抽取,对认知属性进行确定及编号。
[0076]
认知属性确定的具体步骤如下:本实施例根据拟定的调查问卷,选取30名信息安全相关专业的大学教师、博士研究生和硕士研究生对网络安全基础知识、防诈骗意识、密码管理方式等方面进行梳理,提炼出网络安全相关理论及实际应用操作的认知属性,30名师生分别对问卷中涉及的认知属性进行枚举,将所有枚举出的认知属性进行合并,并将合并结果返回给师生重新勾选其认同的认知属性,将认同人数超过20的认知属性归入最终确定的认知属性集合。
[0077]
在刻画受试者网络安全意识或知识结构时,可在认知属性基础上利用属性层级关系图来表示相关任务的认知模型。属性层级关系主要有以下四种基本类型:分支、线性、收敛以及无结构型,可以反映出认知加工过程的结构次序,从而探究受试者对网络安全防范及社会工程学攻击的认知程度以及等级。具体步骤如下:
[0078]
首先,构建认知属性集对应的关联矩阵,其行数和列数均与认知属性集中属性个数相当,其每行每列的元素对应一对属性有序对;
[0079]
关联结果用矩阵或表格表示(表格或矩阵的某个元素即对应一个认知属性有序对)。
[0080]
其次,各用户对认知属性依赖关系进行两两判断:认知属性间具有有向依赖关系,将对应的元素设为1,将认知属性间不存在相关关系,其对应的元素设为0;
[0081]
然后,统计关联矩阵中1的元素个数,并判断是否大于用户个数的三分之一,如果
是,将所有元素1对应的属性有序对进行有向连接,形成认知属性关联图;否则,不予处理;
[0082]
最后,检查认知属性关联图中是否含有环;如果有,则忽略环上的相关认知属性;否则,不予处理;从而完成认知属性层级关系的构建。
[0083]
将认知属性关联图中的每个子图分别作为一个理想掌握模式,根据属性间的层级关系计算各理想掌握模式的安全评分,计算公式为:
[0084]
v为认知属性关联图包含的认知属性个数,e为认知属性间的有向关联数;v为理想掌握模式对应的单个子图中包含的认知属性个数,e为理想掌握模式对应的单个子图中认知属性间的有向关联数。
[0085]
本实施例首先由30名师生分别对问卷中涉及的认知属性进行有向关联,整合所有的关联结果,在关联数超过10的一对认知属性间形成有向边,对所有属性对考察后,检查图中是否含有环,若无环,则完成认知属性层级关系的构建;若有环需对相关部分的属性关系进一步进行讨论。
[0086]
q矩阵理论主要是将不可被直接观察的认知状态与调查问卷中可观察到的试题作答情况关联起来,其中包括邻接矩阵、可达矩阵、理想掌握模式和q矩阵等。
[0087]
邻接矩阵反应各认知属性之间的直接关系,但不包含自身或间接关系;
[0088]
可达矩阵包含各认知属性间的自身关系、直接关系以及间接关系;
[0089]
q矩阵表征测验项目与认知属性之间的关系;
[0090]
理想掌握模式根据属性间的层级关系,确定符合逻辑的掌握模式,并确定该理想掌握模式的安全评分,具体做法是根据理想掌握模式对应子图涵盖的点和边的数量,占认知属性关联图整体的比例由以下公式计算:
[0091][0092]
理想掌握模式较好地定义了不同的掌握情况,对于认知安全意识评估具有重要的参考价值。
[0093]
步骤四、各受试用户填写问卷数据,并进行预处理剔除数据中的异常值及空缺值;
[0094]
步骤五、将各受试用户的问卷答题结果映射到规则空间rsm模型中,获取与各用户答题情况最接近的3个理想掌握模式;
[0095]
规则空间模型(rule space model,rsm)是上世纪80年代提出的一种认知诊断理论,基于统计学和项目反应理论对解决复杂任务时所使用技能成分的程度进行诊断。为了使测试结果稳健可靠,以各受试用户的能力水平θ为横轴,警戒指标ζ为纵轴构造规则空间;
[0096]
说明:θ为受试用户测试结果的反映能力值;ζ表示受试用户安全意识θ实际反应(测试结果)偏离理想反应模式的程度,是项目反应模式异常的指标;
[0097]
获取最接近的3个理想掌握模式过程为:
[0098]
首先,rsm模型将每个理想掌握模式都映射到一个规则点坐标每个受试用户的问卷答题结果都映射到实际反应坐标通过计算实际反应坐标与规则点坐标的两两距离进行归类。
[0099]
然后,将距离值按从小到大排序,并选择前3个距离值对应的理想掌握模式,与距
离组成对组:((m1,d1),(m2,d2),(m3,d3))。
[0100]
步骤六、通过无监督聚类将认知属性关联图中所有理想掌握模式进行分类,并归纳出认知属性的安全等级;
[0101]
由于网络安全涵盖范围广、涉及概念和技术多,同时用户安全知识储备与实际操作间关系多样,构建的认知属性层级结构复杂庞大,其中包含的理想掌握模式数量繁多,采用无监督聚类方法可以有效地对认知模式进行分类并归纳出认知模式的安全等级。
[0102]
认知属性的安全等级分为好、较好、一般、较差和差五种等级;
[0103]
首先,采用deepwalk图表示算法对各理想掌握模式对应的子图进行嵌入表示:
[0104]
deepwalk基于随机游走策略,在理想掌握模式子图中首先选择某一认知属性节点作为起始位置,在认知逻辑关系的约束下随机游走生成序列,采用与自然语言处理中词嵌入类似的方法计算节点的上下文环境,利用图中节点的共现关系得到各认知属性的低维稠密向量(取维数为300维),并取理想掌握模式中各认知属性的向量表示的平均值作为理想掌握模式的嵌入表示。
[0105]
具体分为以下三个步骤:
[0106]
随机序列采样:从属性层次关系图中,依次使用每个认知属性作为起点,规定路径长度,采用随机游走策略采样,获取与其关联局部的训练数据;
[0107]
局部结构学习:将网络中认知属性采用向量嵌入表示,通过最大化认知属性共现概率对认知属性向量进行训练学习,并采用层级softmax方法以提升性能和效率,最终得到网络各认知属性的向量表示;
[0108]
采用kmeans无监督聚类算法对各理想掌握模式进行分类:认知安全评估将按照受试者的认知安全意识分为好、较好、一般、较差和差五种等级,理想掌握模式的向量表示:将理想掌握模式包含的各认知属性的表示向量求平均值以作为理想掌握模式的嵌入表示。
[0109]
因此,取类簇质心数k=5;初始时在理想掌握模式的嵌入空间r
300
中随机选取五个类簇质心向量c
i
=(c
i,1
,c
i,2
,...,c
i,j
,...,c
i,300
),i=1,2,3,4,5;
[0110]
进一步,计算各理想掌握模式的嵌入表示向量与各类质心向量的欧氏距离,并将各理想掌握模式归入相距最近的类簇;
[0111]
距离计算公式如下:
[0112][0113]
其中x
j
为第j个理想掌握模型的嵌入表示;
[0114]
最后,根据分类结果重新计算类簇质心,迭代上述过程直至质心位置不再变动时得到五个类簇质心向量以及各理想掌握模式的归属类别;
[0115]
将各类中所有理想掌握模式的安全评分score求取平均值,并由高到低排序,依次对应认知安全意识好、较好、一般、较差和差五种等级的类簇质心向量,分别对应认知属性的5个安全等级。
[0116]
步骤七、将各用户最接近的3个理想掌握模式对应的距离值分别进行归一化,根据归一化结果加权平均,选择最接近的分数对应的等级作为该用户的认知安全意识安全评估的结果。
[0117]
归一化计算公式为:
[0118]
认知属性的5个安全等级对应分数为1

5分,其中好对应5分,差对应1分。
[0119]
实施例:
[0120]
首先,设计的调查问卷,参考hais

q(human aspects of information security questionnaire)模型,设置题目涵盖基础知识、计算机知识、行为偏好、网络安全意识、认知心理、认知风格和认知反应7个方面;并利用预测试结果对问卷进行信度分析以评判问卷的合理性和正确性;
[0121]
然后,对调查问卷涵盖的网络安全及社会工程学相关内容进行认知属性分析,确定认知属性层级关系和理想掌握模式;
[0122]
进一步,对受试者填写的问卷数据进行预处理,剔除数据中的异常值及空缺值;应用认知诊断模型对受试者的认知水平及结构进行分析;
[0123]
通过无监督聚类将理想掌握模式分类;
[0124]
最后,综合认知诊断模型评分和认知模式聚类结果,对用户进行认知安全意识等级评估。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1