【摘 要】
:
随着越来越多的人参于网络内容的编辑,“分众分类”法也逐渐成为网络资源分类的重要方法。本文主要研究“分众分类”法的优缺点,对其缺点之中的“模糊性”进行了针对性研究,
论文部分内容阅读
随着越来越多的人参于网络内容的编辑,“分众分类”法也逐渐成为网络资源分类的重要方法。本文主要研究“分众分类”法的优缺点,对其缺点之中的“模糊性”进行了针对性研究,在认真分析其产生原因与深入研究他人成果的基础之上,提出了自己的聚类改进方案,并设计了抓取和聚类程序;在框架设计过程中,将整个程序分成抓取数据、清洗数据、聚类、图形显示四个部分。通过VC++6.0与SQL2005平台的混合编程,实现了程序总体框架,并利用设计模式将四部分有机地结合在一起,做到了低耦合高内聚、易扩展和易维护。最后对其功能是否正确,数据库是否被正确地访问以及聚类结果是否合理进行了黑盒测试,分析了“基于语义的聚类方案”形成的簇集,对是否达到预期目的进行判断,并在多次改变聚类条件后,分析并找出影响形成不同簇集结果的原因。通过对“分众分类”法中标签进行研究,并通过聚类重新组合标签组形成簇集,即对大众分类进行二次专业分类形成新的标签组,降低了标签的“模糊性”,从而提高了网络用户查询时的“检全率”、“命中率”、“命准率”。
其他文献
图像边缘囊括了图像的所在位置、信息分布比重及细节纹理等特性,是形成一幅图像最关键的特征。因此,关于图像边缘的特征分析、研究及提取的新思想和新技术层出不穷。而到目前
在高速的_瓦联网主干信道上以零或非常低的丢包率获取IP报头并将其存储为IP TRACE需要非常强大的硬件平台的支持。这些IP TRACE是所有从事网络流量及相关领域研究的唯一的真
日盲紫外光通信作为一种新的通信手段,由于其保密性强、抗干扰能力强及可实现非视距传输等优点,可用于多种近距离抗干扰通信环境,近几年来受到军事强国的广泛关注。本课题基
无线传感器网络是一种由大量传感器节点通过无线通信技术自组织构成的网络。其中,如何降低平均能量消耗,延长传感器节点生命周期是当前研究的主要问题。本文首先介绍了无线传
随着Internet的普及和网络服务(Web Services)的广泛应用,如何提高应用系统的性能成为软件性能测试领域的研究热点。压力测试是评测系统性能的关键手段,对评测系统可靠性和健
近年来,市场对汽车电子功能的需求开始变得愈发强烈,使得汽车制造商不得不依赖于全行业统一的标准化体系,以及通用性、互换性更强的软件来降低软件的复杂度。汽车开放体系架构(A
传感器节点的能量限制直接决定了无线传感器网络的工作寿命。因此,传感器节点能否高效地使用能源是无线传感器网络设计中最重要的目标之一。在无线传感器网络的数据传输过程
地形可视化是当前地理信息系统重要的研究内容。要完成地形可视化,先要将地形信息数字化存储。数字地形信息存储方法主要有不规则三角网方式和规则网格方式两种。其中不规则三
随着国际互联网络的不断普及,数字产品的非法获取和拷贝问题变得越来越严重。随之,数字产品的版权和完整性保护也逐渐为人们所重视。较成熟的方案是用密码学来保障多媒体信息
命名实体翻译是跨语言信息抽取、机器翻译等跨语言信息处理领域的一项重要任务。命名实体因类别不同采用的翻译方法不同,人名、地名主要采用音译,组织机构名主要采用音译与意