WEB文本分类相关论文
本文提出潜在语义分析的Web文本分类方法,该方法认为在词汇之间,词汇与文本之间存在着某种上下文的关系,多篇文本与多个词汇可以由......
该文所取得的主要成果和创造性工作如下:1.提出了基于二次熵的互信息QEMI特征选取的方法.特征选取是文本分类挖掘中的关键技术,是文......
为促进东亚地区植物遗传资源的保护和利用,国际植物遗传资源研究所(IPGRI)与东亚各国有关研究机构决定建立“东亚植物遗传资源协作......
当前网络正在深度和广度方面飞速地发展着,Internet上包含了大量的信息资源,如何在这些大量、异构的海量信息资源中,快速有效的发掘蕴......
万维网已经和我们生活的各个方面紧密联系在一起了。我们使用它获取信息,与人们进行交流,使用万维网更加高效地工作,进行各项社会......
在网络信息的急剧膨胀时代,我们已经不再担心信息的匮乏。但是,网络信息的指数级增长开始让人们感到信息的泛滥和杂乱无章。各大网......
当今的世界,信息充斥着各个角落,以电子形式存在的Web文本已逐渐成为人们最重要的信息来源。然而,Web文本是无结构的、动态的,并且Web......
文本特征向量存在相关性大,维数高的特点。支持向量机对于特征相关性问题不敏感,处理高维度问题具有较大优势。Web上不但存在海量......
研究维、哈、柯多文种信息检索中web文本分类问题。根据维、哈、柯Web文本具有结构信息的特点,提出了分类系统框架,采用了基于KNN......
研究维、哈、柯多文种信息检索中web文本分类问题。根据维、哈、柯Web文本具有结构信息的特点,提出了分类系统框架,采用了基于KNN......
本文主要研究利用人工免疫系统进行Web文本挖掘的方法。 第1章首先对选题背景进行了介绍,然后介绍了免疫学的发展历程和主要研......
伴随着Internet的飞速发展,Web上出现了海量的、异构的、半结构化的、动态的信息资源,并且在这些Web信息中有80%以上的信息是以文本......
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的......
随着Internet的飞速发展,网络上的web信息资源迅速膨胀,如何在浩瀚的web文本信息资源中高效精确地挖掘出有用的知识已经成为目前的......
研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN......
随着Internet及其相关技术的迅速发展,网络上汇集了大量的信息资源,如何有效地利用这些资源,一直备受学者的关注。目前广泛使用的......
WEB文本自动分类在很多方面都有着重要的应用,如信息检索,新闻分类等。决策树算法是一种简单并且广泛使用的分类方法,具有很多优点如:......
KNN方法存在两个不足:a)计算量巨大,它要求计算未知文本与所有训练样本间的相似度进而得到k个最近邻样本;b)当类别间有较多共性,即......
Web文本分类是在给定分类体系下,根据Web丈本内容判定丈本所属类别的一种分类方法。当丈本类别数量庞大或者类别复杂时,可采用基于向......
随着Internet的飞速发展,网络上的web信息资源迅速膨胀,如何在浩瀚的web文本信息资源中高效精确地挖掘出有用的知识已经成为目前的研......
查询扩展技术中引入语义计算是一个重要的研究方向。针对现有解决方法普遍存在缺少主题知识、引入无关词以及筛选函数不恰当的问题......
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web......
web文本分类技术是数据挖掘中一个重要研究领域,为了能从海量信息中快速检索遍布网络各处的文档,需要提高web文本分类技术的性能。多......
在信息技术飞速发展的今天,地震预报智能决策系统和地震信息系统迫切需要新技术的融入。Web挖掘是目前信息技术中的研究热点,它是......
通过研究html网页结构,实现对Web网页中纯文本内容的提取。通过对传统的特征提取方法和文本分类方法进行研究,提出基于概念词典的......
在文本分类中获得有类别标记训练样本的代价是很高昂的,本文针对这个问题对传统的模糊聚类方法进行改进,提出模糊划分聚类方法FPCM,将......
SVM是在模式分类中表现优秀的一种分类方法。通过对现有SVM的两种增量算法的分析,给出了改进措施,在此基础上结合类加权思想.提出了一......
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集......
构建了关于Web表格特征信息知识的领域本体,提出并设计了一种用于Web文本分类的二次分类模型。该模型使用支持向量机方法对测试样本......
以向量空间模型作为Web文本的表示方法,对传统的TF*IDF公式进行了改进。首先,结合Web文本中HTML标签的修饰功能,体现了特征词在Web文本......
针对现有多分类支持向量机算法所存在的训练时间长、判别速度慢等问题,提出了一种二叉树多类支持向量机算法,该算法能够有效减少支......
Web文本分类是Web数据挖掘的一个重要研究方向,本文在研究了Web文本分类的特征项权重计算方法的基础上。提出一种改进的TF-IDF特征......
将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中,实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个......
Web文本分类是Web文本挖掘的一个重要研究领域。Web文本分类中通常采用向量空间模型(VSM)来表达文本特征,但是所产生的维数是巨大的,从......
随着Internet的飞速发展,Web文本分类研究已经得到人们密切关注,并取得了大量的研究成果。基于向量空间模型(VSM),针对传统的Web文......
研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN的W......
考虑到实验数据的大规模及样本数据形状的复杂性等特点,提出一种基于分级聚类与DBSCAN聚类相结合的HL-DBSCAN聚类算法,避免了DBSCA......
Web文本自动分类技术是Web文本挖掘的关键技术之一。针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特......
面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题。针对Web文档的多主......
本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊一粗糙集的文本分类模型、多分类器融......
通过分析现有SVM的两种改进算法:半监督学习算法和增量学习算法,给出了对现有的增量学习算法的改进,提出了一种新的半监督增量SVM学......
Web文本分类是采用文本分类技术将Web上的信息进行自动分类,使用户能够快速找到自己想要的资源。文本分类的过程中,将特征提取之后......
WEB是人们获取信息与知识的重要途径,它的海量性、多样性、动态性和半结构化等特性增加了其信息进行自动处理的难度,也吸引了研究者......
在Web文本分类中当类别数量庞大或者类别复杂情况下,层次分类是一种有效的分类方法,但其不足之一是在大类正确划分的前提下,由于子类......
论文设计实现中文搜索网页分类系统,包括:关键字搜索结果网页类型判断方法,网页主题内容提取。对于不容易分类的网页,采用基于摘要的网......
针对Web文本的特征提取方法多种多样,但均存在各自的不足且对数据集偏斜问题普遍没有很好的解决能力,针对该问题采用BNS特征提取算......
针对基于互补贝叶斯的分类算法在数据倾斜分布时由于过学习现象导致分类准确度不理想的状况,提出一种改进的互补贝叶斯分类算法。......