【摘 要】
:
为了解决用户在敏感内容检测时给定关键词较少的问题,在此提出一种基于语义扩展技术识别敏感数据的方法。主要是通过对用户给定的关键词,进行基于搜索引擎、百度百科以及搜索
【机 构】
:
杭州世平信息科技有限公司,中国国防科技信息中心
论文部分内容阅读
为了解决用户在敏感内容检测时给定关键词较少的问题,在此提出一种基于语义扩展技术识别敏感数据的方法。主要是通过对用户给定的关键词,进行基于搜索引擎、百度百科以及搜索引擎结果页面三种模式的语义扩展,然后借助少量人工方式整体评价,得到用户所需的扩展词。实验结果表明,与语义扩展之前相比,语义扩展之后敏感数据识别的准确率P、召回率R和评价值F均有所提高,说明该方法能够有效地提高敏感数据识别结果的全面性和准确性。
其他文献
果农在采收板栗后,在脱粒的时侯经常会看到体长50 mm左右蛀食栗苞和栗实的小虫,栗实内充满虫粪,且有丝状物粘连,这个小虫就是桃蛀螟。桃蛀螟是一种世界性害虫,除为害板栗外,
目的:研究清肝饮煎剂(qingganying,QGY)对由对乙酰氨基酚(AAP) 所致肝损伤小鼠的保护作用.方法:采用AAP诱发小鼠肝损伤模型,观察小鼠血清丙氨酸氨基转移酶(ALT)、天门冬氨酸
堆叠是一种将多台设备虚拟成一台设备来管理和使用的技术,它能够简化交换机管理,提高其可用性和性能。在堆叠技术的实现过程中,堆叠各成员在实时运行过程中动态表项、协议状态、
着眼于高职高专英语教学模式研究,提出在学校体制转型期英语教学如何能更加适应大学教育要求,达到大学英语教学目标,从而为高职高专英语教学向大学英语教学顺利转变提出可行
患者,女,26岁,因孕足月下腹坠痛于2005年2月11日被我院产科收住院。体检:体温36.5℃,脉搏72次·min^-1,呼吸率20次·min^-1。血压110/80mmHg(1 mmHg=0.133kPa)。行剖宫术后,因有
研究椭圆、双曲线、抛物线上三点构成直角三角形的充要条件,得到若干有益的结果。
The necessary and sufficient conditions for constructing a right-angled triangle at
背景:老年腰椎退行性疾病的手术治疗中,有时需要进行长节段固定融合,在获得稳定的同时,可能带来固定节段近端交界性后凸(PJK)。目的:回顾腰椎长节段固定融合病例,对PJK发生的
文章采用实地调研和网络调查的方法,对《中华人民共和国公共图书馆法》施行后湖南省发生的涉及公共图书馆的案件进行调查。根据调查数据归纳得出湖南省涉及公共图书馆案件的
在现代农业养殖领域,温度是一个非常重要的影响因素。为了对所在区间的温度进行实时监测和适时调控,设计一种基于增强型51单片机、DS18B20数字温度传感器、NRF905无线通信芯片