分层聚类算法在文本挖掘中的应用

来源 :网络安全技术与应用 | 被引量 : 0次 | 上传用户:bassjhnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。
其他文献
期刊
近日,一名带有呼吸道感染症状的5个月大男婴在诊所输了5天消炎药不见起色,被送往医院治疗,经进一步检查被确诊为小儿川崎病。经过近半个月的治疗,患儿已康复出院。川崎病早期症状与普通感冒类似,夏初时节呼吸道感染的患儿较多,要小心别把小儿川崎病当做感冒,延误治疗。  川崎病又称皮肤黏膜淋巴结综合征,是一种以全身中小动脉炎为主要病理改变的急性、发热、出疹性小儿疾病。患者会有急性发热、皮疹、颈部淋巴结肿大、口
编者按:在西藏雪域高原进行卫星信号的试收,的确是件稀罕的事,特别这又是个发烧友的行为。正是由于这是个体接收的行为,因此文中所述的较弱信号或较强信号所代表的主体频道,也仅仅是作者个人的感觉,并非是该星电视频道的真实表现。没有标准的正规测量设备和正确的测量方法,是难以判断卫星信号强或弱的,也无法得出正确的结果。      在全国众多烧友的接收记录中有一个空白地区,那就是西藏地区,在一个特殊条件下我来到
肿瘤患者往往由于自身疾病或放化疗的原因出现恶心、呕吐、味觉改变等;在饮食上还能做哪些调整来应对呢?下面介绍一些简单易操作的饮食原则和改善方法,肿瘤患者及其家属不妨试试。  恶心、呕吐的原因多由肿瘤本身、化学药物或放射性治疗所引起。对策如下:  1.少食多餐,避免空腹或腹胀。  2.不要用勉强吃、喝的办法来压住恶心和呕吐。  3.避免太甜或太油腻的食物;可饮用清淡、冰冷的饮料,食用酸味、咸味较强的食
如今,全国城市地区癌症的发病与死亡都已经超过心脑血管病排在第一位。在恶性肿瘤死亡排序中,不管是男性还是女性,肺癌都是第一位。说到肺癌的诱因,不得不提到“气”这个字。总结起来,有四种“气”可归结为肺癌的高危因素。  ■ 烟 气  烟草中有几百种有害物质,这些物质通过漫长的20年以上的刺激,是肺癌的首要发作因素,85%以上的肺癌患者的死亡都与吸烟相关。  ■ 大 气  大气污染、环境污染是我国肺癌高发
期刊
期刊
期刊
期刊