基于类间离散度的文档敏感内容识别算法研究

来源 :第十届中国通信学会学术年会 | 被引量 : 0次 | 上传用户:ycbydd21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  敏感数据信息一旦被外泄,后果将不堪设想。而防泄密管理中亟待解决的重大问题,即是如何能快速、准确地从大量数据信息识别敏感内容。本文首先基于敏感文本库,训练已知分类文本集;在简便有效的文本敏感特征提取方法的基础上,引入类间离散因子修正传统的TF-IDF权值确定方法;随后利用支持向量机构建分类器,以识别和判断敏感文本内容。实验表明,在查准率、查全率、F1测试值,虚警、漏检,以及处理时间等方面,该算法具有较高的准确性和高效性。
其他文献
随着VoLTE技术迅速发展及产业链逐步完善,快速部署LTE FDD网络以实现全面覆盖的需求越来越强烈.农村、矿区等区域具有覆盖面积大、用户密度低的特点,采用常规1.8GHz频段实现L
  LTE 800M产业链的逐步成熟以及特殊场景的实际需求,使得在800M频段建设LTE FDD网络成为可能.TAL规划是LTE网络规划的重要组成部分,需针对LTE 800M进行精细的TAL规划.介绍了
墙体起到承重、围护或分隔空间的作用,是建筑物的重要组成部分。传统墙体生产过程浪费大量的能源并污染环境,然而预制组合墙体等新型墙体的出现改变了这一局面。预制组合墙体是
城市场景是4G网络部署的重点区域,仅使用宏基站组网无法满足4G网络室外连续覆盖、室内深度覆盖及网络高容量高速率的需求.针对以上问题,通过分析城市场景覆盖问题,提出城市场
针对现有无线局域网入侵检测BP神经网络算法存在的局部极小点和收敛速度慢的问题,引入了PSO-BP算法,并对其惯性权重进行了改进,解决了PSO-BP算法精度低、易发散的问题.仿真实
钢—混凝土组合结构是介于混凝土结构和钢结构之间的一种新的结构形式,是混凝土和钢材两种材料的合理组合,既可充分地发挥两种材料的优点,又能弥补彼此的弱点,因而此种结构优于其
在可持续发展战略背景下,国家对于建筑工程材料提出了更高的要求。与此同时随着材料技术的发展,高强材料诸如高强混凝土应运而生并得到越来越多的应用。然而传统的普通混凝土抗
无网格法是近年来发展迅速的一类数值分析工具,其中的无网格伽辽金(EFG)法就是应用和研究最为广泛的无网格方法之一。与有限元法相比,它回避了网格畸变带来的困难,在解决裂纹扩展
随着土工合成材料的发展,加筋土技术已经应用于挡土墙、堤坝、护坡、水利、环境等工程领域。根据现阶段对加筋土填料的研究,表明只有砂性土才能充分发挥筋材与土界面之间的摩阻
结构的地震损伤可以通过结构物理参数的变化来估计,这样就可以借助于结构物理参数识别方法来识别结构的地震损伤。为了达到这个目的,首先需要识别出结构损伤后的物理参数,然后计