【摘 要】
:
随着Internet的发展,网上的信息量在飞速的增长。同时,信息的内容也逐渐多样化,各式各样的内容涌现到网民面前,其中不免有些不良和不安全信息的存在。如何有效的从众多的信息
论文部分内容阅读
随着Internet的发展,网上的信息量在飞速的增长。同时,信息的内容也逐渐多样化,各式各样的内容涌现到网民面前,其中不免有些不良和不安全信息的存在。如何有效的从众多的信息中尽快的获取真正所需要的内容?如何避免不良和不安全的信息在网上传播?信息过滤为其提供了一种解决方案。Internet上的信息大部分是以Web文本的形式出现的。对Web文本内容进行过滤,涉及的主要技术包括:中文分词、特征提取、文本分类等。中文文本信息过滤的过程一般是把整个文本进行中文分词,根据特征项将文本转换成向量的形式,通过一定的数学模型对向量进行计算,根据计算结果对文本进行分类。过滤的实质是在用户阅读信息之前先代替用户对文本的内容类别做出选择,把与用户需求无关的内容过滤掉,以提高用户获取信息的效率。基于多层次的Web文本信息过滤方法是模仿人类信息过滤的方法而提出的。人们平时看报纸或书籍时,先对报纸或书籍进行浏览,根据标题或者书的目录选出喜爱的文章,再去详细的阅读。方法将文本的表示分为标题和正文两个层次。在过滤时,先对标题内容进行关键字过滤,如果通过筛选,则直接将文本提交给用户供用户阅读;否则将正文的文本表示成向量的形式,由神经网络分类器对其进行分类。神经网络分类器先采用弹性BP学习算法对神经网络进行训练,对网络的一些参数进行调整,最终形成效率较高的神经网络。当新的待分类文本的向量到达时,直接用训练过的神经网络对其进行分类。
其他文献
随着全球化经济的不断发展,企业之间、企业部门之间的跨区域合作日益频繁。制造业同样也受到了前所未有的挑战,为了快速应对瞬息万变的市场需求,提高产品设计质量缩短产品设计周
以社会救助、社会保险和社会福利为基本内容的社会保障制度是现代市场经济的一个重要组成部分和标志。信息化技术发展日新月异,新技术的出现在提高人们对信息的掌握和操控能力
需求工程是软件工程初期的重要工作,其目的是得到对需求的准确清晰一致的描述以及相应的求解限制。随着需求工程的发展,基于场景的需求获取逐步得到了软件工程界的重视,出现
随着无线通信技术、嵌入式技术、计算机技术以及微电子技术等前沿技术的发展,使得能耗低、功能强的无线传感器得到快速发展。这些传感器拥有体积小,感知环境、数据采集、数据处
人脸识别作为生物特征识别技术中的典范,在人们生活中的许多领域都有着良好的应用前景。人脸识别在数十年的研究里,已经取得了很大的进步。目前在简单且固定的条件下人脸识别
无线传感器网络是由大量在空间中分布的具有通信及计算能力的传感器节点以无线多跳的方式组成的一种分布式自组织网络。它集成了传感器技术、无线通信、微机电系统、片上系统
聚类分析是把数据对象或规则划分成若干个子集的过程,每个子集代表了一个簇,其目标是使得簇中的对象彼此的相似,而与其他簇中的对象尽可能的不相似,聚类分析已经广泛地应用到
医学图像分割算法的研究是医学图像处理永恒的话题,是一个多学科交叉的研究领域,它涉及数字图像处理、计算机图形学以及医学领域的相关知识。在诊断医学、手术规划及模拟仿真
动态目标检测与跟踪是智能监控系统的重要组成部分,它融合了图像处理、模式识别、自动控制及计算机应用等相关领域的先进技术和研究成果,是计算机视觉和图像编码研究领域的一个
随着网络的飞速发展,互联网上信息资源的数量急剧增加,为了从海量的数据中挖掘出有用信息,搜索引擎作为网络信息检索的主要工具迅速产生并发展起来。然而,任何一个搜索引擎都