【摘 要】
:
在对标准蚁群算法分析研究基础上,结合中文文本数据的特点,对蚁群算法存在的缺点进行改进,提出一种基于改进的蚁群算法的中文文本聚类方法--ACTC.算法中为每只蚂蚁增加两个记
【机 构】
:
浙江水利水电专科学校,杭州,310018
论文部分内容阅读
在对标准蚁群算法分析研究基础上,结合中文文本数据的特点,对蚁群算法存在的缺点进行改进,提出一种基于改进的蚁群算法的中文文本聚类方法--ACTC.算法中为每只蚂蚁增加两个记忆体,可以解决原算法中的“未指派现象”;模拟信息素,从而使蚂蚁的移动更具目的性,加快聚类速度;引入“边界点”思想,从而不仅可以消除“停滞现象”,而且能避免“噪声”或异常数据对聚类结果的负面影响;引入动态调整相似度阈值概念,从而使聚类结果更具实际意义.实验证明,从熵值与纯度两个评价函数评价结果看,该算法的聚类效果较好,达到算法改进的目的.
其他文献
针对广州大学城图书馆一直未能实现文献资源共享的现状,从规模、网络条件、计算机管理系统等三方面介绍广州大学城图书馆的基本概况,提出实现大学城高校图书馆通借通还的两种
从知识管理流程角度,系统地分析SDN企业实施知识管理(KM)的软件系统需求,给出该软件系统的功能需求、数据需求、用户界面、流程图及相关说明等内容;同时,指出该软件系统在实
针对网站信息检索精确度不高、交互效率低下以及用户体验感不佳等问题,在仔细分析Google Suggest功能与实现原理的基础上,结合Ajax技术在提高数据交互性能以及解决页面重载问
为了使工作更省力、更方便,人们发明了各种机械,杠杆就是最简单的机械.我们在学习杠杆这部分知识时,经常遇到求或作最小动力的问题,很多同学感到无从下手.下面我们一起从认识
详细介绍一种生物主题爬虫的设计及实现方案,通过优化初始种子模块、主题相关度分析模块、排序模块等四个模块的共同运行实现对网页信息的处理。用高效的主题爬虫取代传统搜
基于内容的图像检索技术是对图像的物理内容为加工对象的检索技术之一,主要实现方式包括基于颜色、纹理、形状、空间位置和语义等.其中基于颜色的图像检索发展最为成熟,而基
从图像语义层次描述方式、图像语义抽取方法两个方面对利用语义进行图像检索的研究状况进行总结,提出建立语义模板用于支撑高层语义检索,同时应用多层次的相关反馈方法建立和
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成.与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,