【摘 要】
:
本文针对基于关联规则的文本过滤器设计做了如下探索:(1)针对中文网络语言的特点,引入n-Gram方法提取文本的特征;(2)提出边界样本的概念;(3)在设计基于关联规则的文本过滤器时,引进了否
【机 构】
:
宁波工程学院电子与信息工程学院,攀枝花学院电气信息与工程学院
论文部分内容阅读
本文针对基于关联规则的文本过滤器设计做了如下探索:(1)针对中文网络语言的特点,引入n-Gram方法提取文本的特征;(2)提出边界样本的概念;(3)在设计基于关联规则的文本过滤器时,引进了否定选择算法,采用否定选择算法对过滤器的检测器集合进行自体耐受,最终建立高准确率的文本过滤器。实验表明,经过自体耐受的过滤器可以有效地提高过滤准确率。
其他文献
以狭叶荨麻为原料,采用酸性染料法,研究了大孔吸附树脂吸附和分离狭叶荨麻提取液中生物碱的方法和条件。研究结果表明,AB-8大孔吸附树脂对生物碱有较好的吸附能力;40%vol乙醇
在阐述Web文本过滤基本理论的基础上,介绍实现Web文本过滤系统WTFilter(Web Text Filter)的几个关键技术:分词、特征提取,分类器的设计。以神经网络作为分类器,并应用遗传算法优化
电影与文学是两种表达方式与接受形式截然不同的艺术,但却都在通过叙事反映人类的思想和情感。两者独立发展,却又始终互动,电影改编文学的实践突出地体现着文学与电影的互动关系
随着因特网的发展出现了所谓的“信息过载”问题,为了向用户提供个性化、实用性的信息,信息过滤技术应运而生。结合国内外已有的研究成果,本文从用户的信息需求与表示、文档的表
改革开放之后,中国水彩画受到本民族绘画传统与西方现代绘画艺术相融合的影响,在艺术审美特征方面呈现出多元化的发展趋势,不仅扩大了水彩画的艺术表现形式,也进一步使水彩画
文章在介绍了云物流以及第四方物流概念的基础上,对中国实施第四方物流的价值以及实施云物流的优势和局限进行了进一步的分析,继而提出观点,即虽然中国发展第四方物流还有很
利用RT—PCR技术从巨峰葡萄中克隆获得RS基因的全长cDNA序列,并利用农杆菌侵染法转化黄芪。试验结果表明:经VectorNTI 11.0软件分析克隆获得的尺S基因全长序列长度为1241bp,并带1
根据电网对气象的特殊要求,研制了电网调度专项气象服务信息的采集、产品加工、分发传输的远程气象服务系统。Internet 技术应用于远程气象用户服务系统。
在当前关于中国经济发展模式的反思与争论中,几乎所有学者将重商主义与失当的政策措施相联系。本文认为,这种学术观点极为不妥。不论是新重商主义还是旧重商主义,其本质都在于政
随着网络的普及,网络上的各种不良文本信息也日益增多,如何对这些不良信息进行监控和过滤成为新的研究课题。文章在相关研究基础上,提出了一种基于语义分析的概念网络构建方