一种文档密级自动识别方法与流程

文档序号:12670149阅读:来源:国知局
技术总结
本发明公开了一种文档密级自动识别方法,其中,包括:定义特征词项、特征词项分布向量、特征词项库、段落特征词项空间向量、段落基准库以及文档敏感度;进行预处理,基于训练文档,标定训练文档中各段落密级及与之对应的初始敏感度;抽取段落的特征词项,建立段落空间向量,从而构建段落基准库;在待定密的目标文档中对各段落进行敏感度判定时,通过计算待定密段落与段落基准库中各段落的相似度,锁定与待定密段落相似度最大的段落,以其敏感度作为待定密段落的初始敏感值;基于待定密段落与所匹配段落的特征词项所携带的敏感度的差异,修正待定密段落的敏感度,通过计算目标文档所有段落的敏感度,并获取敏感度最高者作为目标文档的敏感度,确定文档的敏感度及其对应密级。

技术研发人员:谢梅;孟宪哲;姚金利;曾颖明;郝帅肖;曾淑娟
受保护的技术使用者:北京计算机技术及应用研究所
文档号码:201611086915
技术研发日:2016.12.01
技术公布日:2017.06.13

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1