大数据中一种基于语义特征阈值的层次聚类方法

来源 :电子与信息学报 | 被引量 : 0次 | 上传用户:qingtianleng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算、健康医疗、街景地图服务、推荐系统等新兴服务促使数据的种类和规模以前所未有的速度增长,数据量的激增会导致很多共性问题。例如数据的可表示,可处理和可靠性问题。如何有效处理和分析数据之间的关系,提高数据的划分效率,建立数据的聚类分析模型,已经成为学术界和企业界共同亟待解决的问题。该文提出一种基于语义特征的层次聚类方法,首先根据数据的语义特征进行训练,然后在每个子集上利用训练结果进行层次聚类,最终产生整体数据的密度中心点,提高了数据聚类效率和准确性。此方法采样复杂度低,数据分析准确,易于实现,具有良好的判定性。
其他文献
本文以2008年至2013年中国49家中资银行的相关数据为样本,构建动态面板模型分析银行非自愿性超额准备、货币政策与银行风险承担之间的关系。实证研究表明:银行非自愿性超额储
我国刑事立法的发展过程,也就是刑事立法所经历的发展阶段,是指我国刑事立法所经历的时间、内容及其他事项的总称。这一发展过程是与中国特色的社会主义法律体系的形成形影不
河北省土岭-石湖金矿床属岩浆热液石英脉型成因类型.黄铁矿为主要载金矿物之一,其化学成分、形态和电子-空穴心特征具有指导找矿的意义.围岩中黄铁矿富含Co、Se、P;矿体内黄
随着社会经济的发展,人们生活水平的提高,对于室内设计的要求和风格都有了新的思考和理念,人们更加注重环保、绿色、低碳的室内装修,注重生活条件和生活环境的健康、绿色,营
朝阳市位于辽宁西部,是辽河流域内大小凌河流经的主要区域,2015年国家批准辽宁省辽河流域开展国家级生态文明先行示范区建设,在这样一个背景下,朝阳市应抓住这一历史机遇,结
根据农民合作社的发展实际,从法人治理正规化、权利义务明朗化、服务功能多样化、财务核算独立化等"四化"入手,去规范合作社的运营管理,进而提升合作社发展质量。
伴随着京沈高铁的开工建设,朝阳面临着很多发展机遇,同时又将遇到严峻的挑战。分析了京沈高铁给朝阳带来的发展机遇,京沈高铁使朝阳面临的挑战,最后提出了对策思路。
川东北地区海相碳酸盐岩储层具有埋藏深、岩石致密、低孔、低渗透、高温高压和非均质性强等特点,对储层改造工艺的要求极高。通过室内实验,研制了适合该类储层的胶凝酸酸液体
陆相断陷盆地独特的地质结构决定了其发育多种成因类型的坡折带,控制了多种类型的隐蔽圈闭的形成与分布。南堡凹陷多凸多凹,存在断裂坡折带、挠曲坡折带、沉积坡折带和侵蚀坡折
<正>诗、赋是唐代科举考试中文学性极为突出的文体,时人颇有因二体高第者,体现了文学在唐代取士活动中的意义。该书共收作者关于唐代科举考试中诗、赋方面21篇学术文章,从试