Web文本相关论文
论文系统阐述并实现了一套 WEB 文本分类的技术。主要技术包括 WEB 文本收集、WEB 文本预处理、处理后的 WEB 文本的中文分词、预......
随着Web2.0的深入发展,社会化标注系统不断普及,标签这一应用受到越来越多用户的关注与使用。标签是对资源的进行描述的词或词组。......
随着Internet的发展,网上的信息量在飞速的增长。同时,信息的内容也逐渐多样化,各式各样的内容涌现到网民面前,其中不免有些不良和......
如何从丰富的网络信息资源中发现有价值的利用信息,是目前一个非常迫切需要解决的问题,网页自动分类是解决这一问题的一项关键技术......
随着网络信息量成爆炸式地增长,人们要在信息海洋中找寻自己需要的信息是十分困难的。这些信息大多数是以网页文本的形式存放的,它......
随着互联网的飞速发展,Web数据以指数级的速度快速增长,对Web资源所蕴涵的潜在价值的需求促进了数据挖掘技术在其中的应用。由于Web......
随着Web技术的发展,网络上现存的主观意见表述文本陡增。主观WEB文本不仅能给其他用户提供客观的参考价值,并且产品生产方也可以及......
随着网络技术的不断发展,Web信息资源的极大丰富,如何高效地获取互联网上的资源以及对资源的有效分析处理,越来越成为数据挖掘工作......
本文采用支持向量机,在面向Web文本内容上对其进行分类识别研究。Web文本内容复杂,向量表示的维数大,内容上的疏密性比较明显而且......
随着互联网的高速发展,Web搜索引擎已成为人们获取信息的必不可少的工具。很多情况下,用户查询的信息都与位置信息相关,比如旅游信......
在如今信息爆炸的互联网时代,随着web文本数量的规模不断增大,人们要从这些海量的文本信息中快速有效地找到自己想要的信息,仅靠人工......
互联网时代的到来导致了 web信息爆炸式增长,人们对于快速获取web文本主旨信息的需求已非常迫切,因此,自动提取文本摘要的自动文摘......
伴随着Internet的飞速发展,Web上出现了海量的、异构的、半结构化的、动态的信息资源,并且在这些Web信息中有80%以上的信息是以Web......
随着互联网技术的发展,人们越来越多的利用Web获得自己所需的资源。由于Web上各种资源非常丰富,包括大量的图片、文本等信息。如何把......
互联网的迅速发展导致网上信息飞速增长,形成了我们不能忽视“信息爆炸”的问题——信息极大丰富却导致知识的难以查询。目前,WEB已......
中国现在正处于互联网、车联网的时代,不同的软件、智能化服务充斥在我们生活的周围。不同领域、不同行业产生大量的数据信息。同......
网络技术已经渗透到了社会生活的方方面面,随着Internet在世界范围内的迅速发展,越来越多的数据库和信息系统不断加入网络,使得Intern......
面对滑坡灾害的威胁,如何获取充足、准确、及时的滑坡灾害信息,对于研究滑坡灾害及减少风险具有重要意义。互联网作为一个拥有海量......
首先对情感分析三项主要分类任务和应用的各种技术进行介绍和分析,总结其发展状况、趋势和进行研究的必要性,最后介绍文本情感分类的......
Web文本分类技术是数据挖掘中一个研究热点领域,而支持向量机又是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有......
特征提取是Web文本挖掘中的一项关键技术,在此就Web文本挖掘中特征项的提取作了一番讨论,并以名字的提取算法为例,介绍了其提取算......
在Web文本数据挖掘中,Web文本数据抽取过程有着至关重要的作用,得到的文本挖掘结果的精度以及文本挖掘的效率都与该过程的结果密切相......
Web挖掘采用数据挖掘信息处理技术,从Web信息资源中发掘用户所需信息.本文在分析Web文本信息特征的基础上,揭示了Web文本数据挖掘......
Web挖掘采用数据挖掘信息处理技术,从Web信息资源中发掘用户所需信息。本文在分析Web文本信息特征的基础上,揭示了Web文本数据挖掘......
支持向量机是建立在统计学习理论的VC维理论和结构风险最小原理基础上发展起来的一种新的机器学习方法。它是在有限样本的基础上,......
文中针对大规模Web文本信息的结构与内容特征提出一种高效的Web文本分类方法。该方法主要包含3个模块:(1)针对Web长文本提出一种基于......
自动文本摘技术的出现为人们快速阅读的带来了极大的方便,本文地对于Web文本的特征设计出了计算词权重系数公式及句子得分公式,并......
期刊
为了更有效地组织Internet上丰富的信息资源,通过分析Web文本的特点,提出了基于KNN的Web文本分类方法,并结合具体实验在对数据进行......
在系统开发中,图文混排是一个难题。在数据库的基础上,采用了编码对图文混排中的图形进行链接式存储,用自动机技术做出合理的解释,......
介绍Web数据挖掘中的核心技术--Web文本挖掘的种类、特点、任务及方法.着重讨论了文本特征的提取、文本分类和群集的算法过程和技......
笔者在实际竞争情报工作过程中发现了现有竞争情报工作中存在的问题——竞争情报的搜集和分析主要依靠人工来完成,效率低下;针对这一......
在论述面向专业知识文本的知识获取方法--自然语言理解与专家系统的不足之后,提出了一种面向机械知识Web文本的知识获取新途径.首......
近年来,无载体信息隐藏凭借其抗检测、抗攻击的优势,迅速成为信息安全领域的研究热点。不同于传统的信息隐藏方法,无载体信息隐藏......
网络上存在着大量的、宝贵的临床医疗信息,仅专业医疗网站就几十个。但从网络上提取医学知识并结构化、建立医学知识图谱,进而实施......
当今信息社会,Internet上的信息资源杂乱繁多,用户很难准确地获得所需的信息。对此,本文提出根据特征词在html网页中的title、keyw......
Web文本情感极性分类算法在网络舆情监控方面具有重要的研究价值.针对传统文本分类算法依赖于情感词典的弊端,以及不能很好的应用......
针对DBSCAN算法采用全局参数Eps、对高维数据处理能力不足等问题,提出一种改进算法,该算法结合蚁群聚类算法实现数据集的划分以获......
目前,如何快速、准确、全面、及时地检索到自己感兴趣的信息已成为人们关注的焦点.本文针对目前搜索引擎精度不高的问题,讨论了Web......
自动文本摘技术的出现为人们快速阅读的带来了极大的方便,本文针对于Web文本的特征设计出了计算词权重系数公式及句子得分公式,改......
对用户发表在Web上的评论进行分析,能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研......
概念格在本质上描述对象和属性之间的联系,表明概念之间的泛化和特化关系.研究了概念格模型的建立方法,应用概念格的理论,提出一种将非......
为构建大规模中文文本语料库,提出了一种简单、有效、通用的中文Web主题文本提取方法。该方法巧妙地利用中文文本长度和标点符号序......
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共......
随着万维网(WWW)中信息量呈指数增长,人们可以使用许多信息收集工具来获得网络中的信息。但要使检索到的信息在满足用户个性化需求方......
针对海量Web文本的关键词提取问题,提出一种基于Hadoop分布式计算平台的关键词提取方案.首先,配置Hadoop平台,使其能够支持自然语......
建立自然灾害预测模型,对自然灾害进行预测和分析,有利于提升防灾减灾的技术水平.基于关联规则和Web文本挖掘技术提出自然灾害预测......