基于聚类的多维数据热点发现算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:RIshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据热点发现的目标是找出数据集中的区域,并以易于人理解的方式将其展示出来.本文针对同时包含数值型特征和类别型特征的多维数据设计了数据热点发现算法,该算法的核心是改进CLTree设计的聚类算法CLTree+.本文改进了CLTree,使其能够直接对同时包含数值型特征和类别型特征的数据进行聚类,并提升了具有周期性性质的数值型特征的聚类效果.除此之外,相比CLTree,CLTree+还大幅度提升了计算效率,使其可以用于处理大规模数据. CLTree+被应用于某大型互联网公司的业务数据,成功找出了若干个数据热点,并以易于理解的特征取值组合的方式将这些信息展示出来.
其他文献
社会契约作为一种调节个人与社会、个人与国家各种矛盾的最有作为的现代性方式,对于性别关系的调节亦具丰富的理论价值与广阔的应用前景。随着社会实践的发展和人的对象性关系
怎样理解和评价中国改革开放30年,国内学界有多种看法。本文就较有代表性的四位学者的观点,即吴敬琏的改革目标模式论、秦晖的改革返正论、甘阳的改革延续论、胡承槐的社会形态
本文探讨义乌市构建新社会共同体的实践与社会整合的关系。笔者认为,义乌市政府通过重新构建适应于移民社会的想象的共同体,增强了各类市民对义乌社会的认同和对"陌生他人"的
一、政策背景及依据为加快发展粮食生产适度规模经营,促进我市农业的转型升级,保障粮食生产稳定发展,根据《宁波市农业农村局宁波市粮食和物资储备局宁波市财政局关于切实抓
Our current task is to collect imagery data on troop deployment2. Vollmer surrounds his Hasselblad3, engrossed in4some microadjustment5.There is a seaward bulge
【正】监理过程实质上就是信息资料管理的过程,监理工作的主要方法是控制,控制的基础是信息。监理资料管理是建设工程信息管理的重要工作,是监理工程师依据工程项目目标实施
立体组合式报道可以从不同角度对某一重大新闻事件进行全方位报道,在国内广播新闻节目中普遍存在着就事论事、结构单一、内容单薄的情况下,多采用立体组合式报道能够满足受众
目的 探讨低k V大螺距联合IRIS在降低胸部多层螺旋CT(MSCT)检查辐射剂量中的临床应用价值。方法 70例行胸部MSCT检查的患者随机分为常规组(n=35,130k V,Pitch 0.8,FBP)、和低剂量
法律制度创新的路径主要有三种,即复兴旧法、移植外来制度和创造新制度。但评价法律制度创新的标准并非新奇性和独创性,而是它满足当前对制度的新需求的能力。无论选择哪种法律
对薄层单元的基本假设和简化进行了探讨并得到如下结论:薄层单元的本构方程可通过横观各向同性体本构方程采用合理简化得到;薄层单元受拉开裂的本构关系可采用分布裂缝模型模拟