半参数聚类与聚类算法分析研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:wwwlucky2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是把数据按照它内在的分布进行分组.数据的分布通常使用参数或者非参数模型来估计.由于实际数据中一般存在孤立点和噪音,导致数据很难服从一个理想的参数分布.因此,我们需要研究合适的方法来获得给定数据集的内在分布.另外,虽然目前研究人员对聚类算法有较多研究,也提出了很多聚类算法对不同的数据进行划分,但是对聚类函数还是很难给出一个明确的定义.针对聚类算法中的以上问题,本学位论文展开了深入的研究.本学位论文总共分为五章,前两章介绍了研究背景和一些相关的聚类算法,第三章和第四章给出了本论文研究的主要工作,最后一章对研究工作进行了总结和展望.第三章提出了一种新的半参数聚类算法把给定的一个参数聚类算法转化为一个鲁棒的聚类算法.首先,我们提出了半参数密度估计模型来揭示数据的内在结构,即对于组成每一类核心的高密度区域数据和处于每类边缘区域的低密度数据,我们分别使用参数模型和非参数模型来估计数据密度,并通过调节参数和非参数的比例来拟合数据内在的分布.基于半参数密度估计模型,我们提出了一个由参数聚类算法与非参数聚类算法相结合的聚类算法,称之为半参数聚类算法.从鲁棒性的角度来分析,半参数聚类算法大大增强了参数聚类算法的鲁棒性.实验结果表明,半参数聚类算法显著地提高了聚类效果.第四章定义了一类聚类函数来对现有聚类算法的性质进行研究.这个聚类函数旨在优化一个衡量类内相似性或者不相似性的目标函数.在这个目标函数中,我们通过选择不同的相似性或者不相似度量函数和惩罚条件,可以得到不同的聚类算法.这为我们研究现有的聚类算法提供了一个新的角度,而且也为我们研究聚类算法的性质提供一个统一的框架.此外,我们还通过把目标函数转化为矩阵的迹来求解相应的最优化问题,并且讨论了数据或度量函数转换后对聚类结果的影响,分析了聚类函数的鲁棒性.
其他文献
农作物间作套种是一项时空使用技术,能充分利用季节、土地、气候等条件,提高复种指数,完成农作物一年多熟种植、高产高效。在农业耗费上,根据农作物之间相生相克的原理进行巧妙搭
随着人们经济水平的提高,建筑项目类型不断增加,要满足的要求也逐渐增多,相关的造价成本随之增加,所以建筑工程造价管理是施工企业成本控制和经济效益的重要影响因素,其中全
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
<正> “脊髓前角灰白质炎”好发于小儿,故习称之为“小儿麻痹症”。有关本病之原始記载,在1840年海內氏首次作了較詳細的症状描述。1934年我国学者牛惠生氏亦报导本病150例。
文学关注人类情感,医学治疗人类身体,二者鲜有交集,这几乎成了世人的共识——文学主观、感性、模糊,充满象征和隐喻;医学客观、冷静、准确,唯数据马首是瞻。文学代表的人文和医学代
报纸
谈浓香型低度白酒除浊谢玉球(江苏双沟酒业集团有限公司;泗洪县223911)一、中低度酒的发展过程当前低度酒发展中,面临的最大问题,就是象老前辈老专家们所讲的,低度酒难题就是“混蛋”问题
中国的传统文化博大精深,源远流长,随着工业化步伐的加快,在新的时代背景下,人们对于中国传统文化的价值渐渐忽略。因此,将传统文化符号进行加工和提取,并进行新一回合的设计
一、用户接入规程 帧中继业务是通过用户设备和帧中继网络之间的标准接口提供用户信息的双向透明传送、并保持其顺序不变的一种承载业务。用户和网络之间的接口称为用户网络
现代艺术设计教育的课程设置与内容组合必须具有时代性与开放性才能充分能动地发展学生的个体综合素质,课程设置应进行多元性探索,增设“中西美术比较”,“专题创意”及其它相关
“身韵”是中国古典舞学科体系中的一个重要组成部分。1978年北京舞蹈学校升格为大学后,业内人士反思过去只找到了传统舞蹈之形貌,并未找到贯穿数千年之久的中国古典舞蹈之神