分层聚类算法在文本挖掘中的应用

来源 :网络安全技术与应用 | 被引量 : 0次 | 上传用户：bassjhnn

【摘要】

：

随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。

【作者】

：

刘卓徐斌

【机构】

：

苏州科技学院电子与信息工程学院,江苏,215011

【出处】

：

网络安全技术与应用

【发表日期】

：

2010年07期

【关键词】

：

数据挖掘 Web文本挖掘分层聚类算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

活学活用WORD & WPS

期刊

勿把川崎病当感冒

近日，一名带有呼吸道感染症状的5个月大男婴在诊所输了5天消炎药不见起色，被送往医院治疗，经进一步检查被确诊为小儿川崎病。经过近半个月的治疗，患儿已康复出院。川崎病早期症状与普通感冒类似，夏初时节呼吸道感染的患儿较多，要小心别把小儿川崎病当做感冒，延误治疗。　　川崎病又称皮肤黏膜淋巴结综合征，是一种以全身中小动脉炎为主要病理改变的急性、发热、出疹性小儿疾病。患者会有急性发热、皮疹、颈部淋巴结肿大、口

期刊

川崎病呼吸道感染颈部淋巴结肿大延误治疗早期症状小儿疾病普通感冒皮肤黏膜急性发热患儿病理改变小心别消炎药动脉炎诊所医院咽部皮疹

雪域高原寻星记

编者按：在西藏雪域高原进行卫星信号的试收，的确是件稀罕的事，特别这又是个发烧友的行为。正是由于这是个体接收的行为，因此文中所述的较弱信号或较强信号所代表的主体频道，也仅仅是作者个人的感觉，并非是该星电视频道的真实表现。没有标准的正规测量设备和正确的测量方法，是难以判断卫星信号强或弱的，也无法得出正确的结果。　　　　　　在全国众多烧友的接收记录中有一个空白地区，那就是西藏地区，在一个特殊条件下我来到

期刊

雪域高原西藏拉萨西藏地区卫星信号特殊条件

放化疗后如何应对恶心

肿瘤患者往往由于自身疾病或放化疗的原因出现恶心、呕吐、味觉改变等；在饮食上还能做哪些调整来应对呢？下面介绍一些简单易操作的饮食原则和改善方法，肿瘤患者及其家属不妨试试。　　恶心、呕吐的原因多由肿瘤本身、化学药物或放射性治疗所引起。对策如下：　　1.少食多餐，避免空腹或腹胀。　　2.不要用勉强吃、喝的办法来压住恶心和呕吐。　　3.避免太甜或太油腻的食物；可饮用清淡、冰冷的饮料，食用酸味、咸味较强的食

期刊

放化疗后肿瘤患者放射性治疗饮食原则味觉改变呕吐化学药物改善方法恶心空腹家属疾病腹胀对策操作

肺癌最容易被“气”出来

如今，全国城市地区癌症的发病与死亡都已经超过心脑血管病排在第一位。在恶性肿瘤死亡排序中，不管是男性还是女性，肺癌都是第一位。说到肺癌的诱因，不得不提到“气”这个字。总结起来，有四种“气”可归结为肺癌的高危因素。　　■ 烟气　　烟草中有几百种有害物质，这些物质通过漫长的20年以上的刺激，是肺癌的首要发作因素，85%以上的肺癌患者的死亡都与吸烟相关。　　■ 大气　　大气污染、环境污染是我国肺癌高发

期刊

肺癌恶性肿瘤死亡心脑血管病有害物质高危因素城市地区癌患者烟气烟草吸烟排序女性男性发病癌症

期刊

期刊

期刊

期刊

分层聚类算法在文本挖掘中的应用

其他学术论文