分级与密度相结合的Web文本聚类算法

来源 :太原师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:jianjiantao456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考虑到实验数据的大规模及样本数据形状的复杂性等特点,提出一种基于分级聚类与DBSCAN聚类相结合的HL-DBSCAN聚类算法,避免了DBSCAN的聚类算法较大的时间复杂度,适用性更广,更能体现一个聚簇的规律,提高分类精度.通过实验与结果分析,取得较好的聚类结果,证明了该算法在文本聚类处理中的可行性.
其他文献
【正】郑州市向阳区北下街人口普查试点工作,从1981年10月28日开始,经过6天登记,5天自查互查,6天手工汇总,于11月13日基本上按试点方案如期完成了任务.
目的评价常规护理基础上辅之相应护理干预在老年股骨转子骨折患者围术期的应用效果。方法选取我院2015年4月~2016年8月收治的老年股骨转子骨折患者116例作为研究对象,将其分
【正】杭州长征业余学校是民革浙江省委响应党中央“广开学路,多方办学”的号召,于1980年秋创办起来的。从初创时开设的工业会计、热处理、英语、日语4门课程,1,684名学员,发
通过文献调研,从奥运会的独立性、商业性、职业性、超大规模、兴奋剂的滥用、三大支柱间的矛盾等6个方面分析了奥运会面临的挑战和一些对策,为奥运会更加健康发展提供参考.
国内首套50Kt/a 1-己烯工业化生产装置日前在燕山石化破土动工。该装置采用燕山石化自主研发的乙烯三聚制1-己烯成套工艺技术建设,预计年底即可建成投产。
考虑到接收系统存在时滞的混沌同步问题,文章提出了一种切实可行的方案.从带有时滞的单向耦合线性误差反馈方法中,针对全局混沌同步提出了一种新的同步方案,并以WINDMI系统为例
考虑带有记忆项的一类积分偏微分方程的初边值问题,采用积分方程理论及Faedo-Galerkin方法,通过积分估计证明了此类方程的初边值问题正则解的存在性.
自组织特征映射神经网络SOM(Self Organizing Feature Maps)作为一种优良的聚类工具,具有无需监督,能自动对输入模式进行聚类的优点,已经得到了广泛的应用.针对SOM可能出现“死结点
文章研究带关闭-启动期的多重休假M^X/G/1排队系统,给出稳态队长的母函数和等待时间的母函数及其随机分解结果.
为了自动精确称量铝水重量,建立了叉车自动称重数学模型,开发了基于可编程逻辑控制器(PLC)的叉车自动称重系统.该系统采用拉力传感器采集拉力信号,通过可编程逻辑控制器进行