基于改进k-means算法的中文词义归纳

来源 :计算机应用 | 被引量 : 11次 | 上传用户:tanchishe0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语中一词多义现象普遍存在,词义归纳就是对在不同语境中具有相同语义的词进行归类,本质上是一聚类问题。目前广泛采用无指导的聚类方法对词义归纳进行研究,提出一种改进的k-means算法,该算法主要从初始簇中心的选取以及簇均值的计算两个方面进行改进,在一定程度上克服了其对"噪声"和孤立点数据的敏感。在特征表示上用同义词词林中词的分类编号来降低特征维度。实验表明改进k-means算法在性能上有较大的提升,F-Score达到了75.8%。
其他文献
教学质量是学校发展的生命线,教师是学校发展的基石,而科研则是优化教师队伍的重要途径,是提高质量教学的重要保证,是学科发展的载体。因此,地方师范院校只有树立以人为本理念,创造
我国在高等师范学院开设公共心理学和教育学的目的是让学生掌握和提高教育教学的知识和技能.文章着重从形成积极互动的师生关系、创设问题情境、进行实验教学几方面,探讨在高
针对压缩域视频流的完整性认证问题,提出了一种基于压缩传感(CS)的视频水印算法。以H.264压缩视频流为研究对象,通过对视频序列的I帧进行压缩传感随机投影,得到少量的测量值,经过量化和置换加密,最后以水印的方式嵌入到P帧具有最大运动矢量幅值的宏块中。认证时,从含水印视频序列的P帧提取水印,并对I帧进行相同的压缩传感随机投影,通过比较测量值的差异,实现对视频的完整性认证。仿真结果表明,该算法具有较好
目的:采用量子化学计算方法进一步确定乌头碱的代谢产物结构。方法:采用密度泛函方法,在B3LYP/6-31G(d)水平上,对代谢产物的结构进行优化,在此基础上计算反应物和产物的能量,用以