文档分类相关论文
本文提出了一种基于单词相关度的聚类方法WCM(Document Clustering Method Based onWord Relation)。总体的思想首先充分利用单词......
随着网络的迅猛发展,其中所包含的文本文档数以百万计,及时进行文档分类处理是十分必要的.本文基于"生产者/消费者"模型,提出了......
文档分类是实现自动化网络舆情处理的一项必不可少的技术.针对文档分类任务中文档信息复杂、难以提取任务相关特征的问题,提出了一......
自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种......
该文在介绍信息搜寻与发现中的"Rich Data Poor Information"问题产生根源的基础上,较为详细地讨论了网络信息的获取以及信息搜寻......
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但因Internet所固有的......
该文通过对信息过滤一般过程的分析,将信息过滤中的相关技术引入到网络安全领域.研究了文档信息表示理论、中文信息处理的方法,利......
该文通过研究数据挖掘以及Web挖掘技术的思想,并结合智能Agent的知识发现模型,提出了基于Agent的分布式Web多媒体内容挖掘体系结构......
互联网是人们日常工作、学习、生活所需信息的一个重要的来源,如何有效的利用搜索引擎来获耿所需的信息已经成为一个非常关键的问题......
随着Internet的普及和快速发展,Internet为我们提供了涉及方方面面的无数的文档资料。因此为了能够在如此巨大并且更新频繁的信息......
随着XML标准的普及,如何对海量的XML数据文档进行快速有效的分析挖掘成为当今一个研究热点。本文深入研究了XML文档中层次化结构特......
当前,随着Internet技术的推广和应用,国际互联网已经成为世界上最大的信息资源库和全球范围内传播信息的最主要的渠道.如何帮助用......
近年来对等网络(Peer-to-peernetwork,简称P2P)发展迅速,在文件共享、普及计算、协同工作、搜索引擎以及广域网络存储等方面有了广泛......
本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了......
随着网络技术的迅猛发展,许多公司都企图借此以更贴近用户的服务提高各自的竞争力。用户到底偏好什么成了他们重点关注的问题。人......
XML文档分类技术在XML数据管理中具有重要的学术意义和应用价值。如何对XML数据实现基于语义信息和结构信息的快速分类学习是当前......
随着网络上的知识的不断暴涨,如何能够快速而有效地按照用户的意图去获取网络资源,成为了一个十分重要而紧迫的问题.准确地获取资......
随着网络技术的飞速发展,信息大量膨胀和聚集,互联网已经形成了一个由数据构成的巨大数据仓库,XML(eXtensible Markup Language)作......
随着互联网上信息的爆炸式增长,通用的搜索引擎很难满足特定用户“专、精、深”的查询需求,在此情况下垂直搜索引擎应运而生。本文......
从1993年中国连入Internet我国的信息化越来越快。Internet的快速发展使它成为人们获取信息的必备工具。但是随着信息化的发展Inte......
应读者要求,我们组织了这个Domino与Web应用技术讲座,讲座分4讲,本期为第三讲。
At the request of the reader, we organized th......
在Intranet上,如果不能对某人在何时何地的所作所为进行控制,它将杂乱无章。
On an intranet, it can be disorganized if it can......
企业信息入口网站结合SharePoint Portal Server 2001平台,以及最新的数字仪表板3.0技术。它除了能提供企业一个快速建构入口网站......
随着Internet上信息的日益丰富,“信息超载”成为了一个大问题,快速、准确、低成本的从信息海洋中获取需要的信息并不是容易的事情......
Web已成为人们获取信息的重要来源.Web数据的产生与传播变得更加自由和便捷,数据量持续爆炸式增长,因而对Web进行监控和预警的需求......
目前,对文档的分类的研究主要集中在提高分类准确率和效率两个方面.由于在现实世界中,大多数文档特别是学术性比较强的文档都是由......
本文比较研究了在文档分类中特征抽取方法对分类效果的影响.考察分析了词频法,互信息法,CHI统计,信息增益法等特征抽取方法.经分析......
文档分类是管理大规模文档信息的一种有效方法,而文档属性选择是文档分类性能的关键.本文分别使用互信息法和遗传算法进行文档属性......
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough-CC4.利用近......
电子病历作为互联网医疗的基础技术,记录了病人的临床诊疗记录,是极具价值的数据资源。我国市级以上医院的病历信息系统的总数据规......
船舶制造业是传统的重型制造业,面对日益激烈的市场竞争和日韩两国信息化造船技术的广泛应用,我国船舶企业必须不断提高响应能力、创......
文本分类是处理和组织文本信息的关键技术,能够帮助有效地组织信息,快速区分有效信息和无用信息,满足用户的个性化需求。本文主要......
根据自适应谐振理论提出了半监督学习自适应谐振理论系统.在该系统中取消了一般半监督学习算法中假定已知数据概率分布的条件限制,......
针对文档水平情感分析传统模型存在先验知识依赖以及语义理解不足问题,提出一种基于注意力机制与层次网络特征表示的情感分析模型T......
本文介绍基于主观Bayes方法的渐进式中文文档分类.包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量.二......
文档的特征提取和文档的向量表示是文档分类中的关键,本文针对这两个关键点提出一种基于word2vec的文档分类方法.该方法根据DF采集......
为了快速准确地对文档进行分类,提出了一种基于局部鉴别嵌入LDE和简化SVM的高效文档分类算法。该算法首先利用LDE算法把高维文档数......
一、光文档存取系统概况 在文档存取设备中,当前最受到人们注意的是把光技术和电子技术结合在一起的光文档存取系统。它利用光盘存......
图模型是文本分类中一种比较新的方法,它可以很好地表达词与词之间的关联信息,弥补了传统的以向量空间为基础的文本分类方法的不足......
自动文档分类是信息处理技术的一个重要部分.本文介绍了分类的模型、相似度的计算方法以及分类算法.在分析比较的基础上,选择合适......
多示例学习已应用于许多场景,如图像分类、恶意软件分类、文档分类、对象检测等。在多示例学习中,训练数据集中的每个数据都是一个......
讨论了基于本体的文档自动分类系统的意义,给出了系统的框架。利用现有的文档自动分类技术,结合领域本体的分类词汇为文档建立索引......