基于DBSCAN的最优密度文本聚类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:yyjay1315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为有效地弥补全文搜索引擎的不足,提出了一种动态求解的最优密度聚类算法并加以实现。该算法构造了一颗簇关系树,将两种典型聚类算法:密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合,对聚类参数ε进行动态求解,以达到参数ε的最优。与其它文本聚类算法相比,该算法的查询结果与用户感兴趣的主题相关度较大,对具有二义性的关键词有较高的查准率,能有效提升搜索引擎的查询效率,加快用户搜索信息的速度。
其他文献
针对基于块处理的图像去噪,最近出现一种新的假设:真实无噪的图像块在块空间中的分布有一定的规律,即会形成若干个低维流形,而在带噪图像中这些流形受到噪声污染而变形,若能恢复这些低维流形便可去噪。若干真实图像的二维块分布表明了该假设的正确性。接下来根据该假设给出了在块空间中通过复原受噪声污染流形来去噪的一个迭代算法。最后还考察了基于该假设图像去噪的最优化模型,即最小化这些流形所对应矩阵的秩。初步实验表明
云环境中任务的动态变化会造成物理服务器之间的负载不均衡,影响物理资源利用率。针对这一情况,提出一种层次分析与物理服务器躲避机制相结合的虚拟机部署与调度策略。按照用户
在仓内吊顶、五面粘贴聚氨酯板以及粮面压盖稻壳隔热保冷基础上,利用浅层地能空调系统对平房仓进行空间补冷控温。开机温度设为22.0℃,停机温度20.0℃,系统根据设定温度自动
本文将从礼法各自起源和主张入手,并进而分析二者争论的内容之不同,认为两者虽然有诸多形式上的不同,但实质上两者有共同渊源和共通之处,这为后世的儒法合流提供了前提和基础
针对基于主题消息中间件系统队列插入效率不高、主题匹配精确性低的问题,对一种基于信息属性的信息分发模型进行研究。通过研究信息的属性,制定合理的优先级,采用基于优先级
近日,南漳县全面实施“人才智力引进工程”。从2001年起,每年由各用人单位向县委组织部申报引进人才计划,由县委组织部、县教委、县人事局从高等院校、科研院所以及省市专业人才
鸭疫里默氏杆菌(Riemerella anatipestifer,R.anatipestifer)属于里氏杆菌属黄杆菌科,革兰氏染色为阴性的短小杆菌,美兰染色为两极浓染,是感染鸭、野鸭、雏鹅等水禽而引起一