【摘 要】
:
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应
【机 构】
:
江苏食品职业技术学院计算机应用技术系,中南大学信息科学与工程学院
论文部分内容阅读
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。
其他文献
摘要:“棕包脑”是瑶族人民的一种带有宗教色彩的民间舞蹈,流行于湖南省洞口县瑶族乡,每年正月十四、十五日进行表演,历史悠久,迄今为止仍在民间流传。“棕包脑”表演的是古老的神话故事,山神送吉祥、财神送宝之类,寄托着瑶族人民的美好愿望,其不仅是瑶族人民的重要文化遗产,且已成为瑶族文化的重要符号。本文是对洞口县瑶族乡“棕包脑”舞蹈的初步考察,记录洞口县瑶族乡“棕包脑”舞蹈的生存现状与传承情况。 关键词:
针对火炮坡膛锥度小,造成弹丸挤进坡膛过程中弹体受力大的争议,采用Johnson-cook塑性本构模型,建立了该火炮的弹炮耦合动力学非线性有限元模型,利用ABAQUS/Explicit求解技术,
企业的信息系统是一个由传统系统、不兼容数据源、数据库与应用所共同构成的复杂数据集合,各部分之间彼此独立。为了保证智能决策的需要,对数据源中的源数据按照一定的数据转换
网络数据包内容检测技术已在网络安全、网络监视、HTTP负载均衡等方面得到广泛的应用,因此,对快速数据包内容的检测就变得异常重要。在数据包内容检测过程中,数据包的净栽数据要
为明确巴布亚盆地主要的含油气系统发育层段——侏罗系的沉积特征及其与油气勘探的关系,在分析前人研究成果、沉积背景与古物源的基础上,通过地震相、测井相、岩心相"三相"联合分析及与周边的布劳斯盆地的类比,识别了沉积微相类型,刻画了沉积体系的纵横向展布特征;通过不同沉积相带生烃指标、储层物性参数对比,明确了有利的烃源岩与储层发育区,以指导油气勘探。研究结果如下:(1)巴布亚盆地在中生代侏罗纪具有宽缓的古地
中南林业科技大学叶蜂标本馆(国际昆虫和蜘蛛标本馆编号:SCSC)建立于1995年10月,主要收藏膜翅目广腰亚目各科昆虫,另有少量其他类群的昆虫。建馆之初,中南林学院昆虫标本室仅有叶蜂
用收缩时间间期(STI)测定法,在检测心脏收缩功能具有一定的应用价值。该方法具有安全、无创伤、无痛苦、操作简便,可反复检查,快速诊断等优点,已经被很多医院应用。本文用此
敦煌盆地是一个处于石油勘探早期阶段的中生代的断陷盆地,油气资源勘探潜力较大,搭建层序地层格架、阐明沉积体系分布是发现油气资源的基础。本文利用露头、钻测井、岩心和地
摘要:本文首先引入自媒体的概念,接着通过对互联网思维、魅力人格体以及IP的分析,阐述其对于影像行业的新启示。最后论述摄影媒介的自媒体特性,成为两次影像变革后的又一次机遇。 关键词:摄影 自媒体性 互联网思维 魅力人格体 IP 中图分类号:J931 文献标识码:A 文章编号:1008-3359(2017)18-0143-02 一、自媒体的概念及特征 自媒体意为:我们,即媒体。在我国,如通过自