一种基于语料特性的聚类算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:hsjxln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为寻求模型不匹配问题的一种恰当的解决途径,提出了基于语料分布特性的CADIC(clustering algorithm based on the distributions of intrinsic clusters)聚类算法.CADIC以重标度的形式隐式地将语料特性融入算法框架,从而使算法模型具备更灵活的适应能力.在聚类过程中,CADIC选择一组具有良好区分度的方向构建CADIC坐标系,在该坐标系下统计固有簇的分布特性,以构造各个坐标轴的重标度函数,并以重标度的形式对语料分布进行隐式的归一化,从而提高聚
其他文献
本文介绍了在<机械制图>课程教学中贯穿三维设计思想,加强轴测图教学和计算机绘图教学的尝试.
车牌识别是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术。车牌识别分为车牌定位、字符分割、字符识别三大部分。车牌定位是一个难题:车牌区域在整幅图像中所占比例很小,车牌的颜色、大小、位置也不确定,并且定位算法要能够克服不同光照和复杂背景的影响,还要兼顾准确性和实时性,因此快速准确的定位车牌是比较困难的。本文通过车牌的纹理和颜色特征,采用粗定位和细定位相
良好的课堂教学效果是保证教学质量的重要前提,也是每一位教师不断追求的目标和理想.本文从教学点、教学量、教学开展过程、课堂教学语言、情感、先进的教学手段和良好的师生
以流通中的商流、物流和信息流为主线,分析了流通技术在我国农产品批发市场中的应用现状和存在的问题,提出发展电子商务,增强农产品批发市场商流模式的多元化、建立物流配送
使用基于有限元法的线性模型,用几种不同的迭代正则化方法进行荧光产额的三维重建,其中包括最小二乘的共轭梯度法(conjugate gradient leasts quare,简称CGLS)、最小二乘的QR分解迭代法(leastsquare QR decomposition,简称LSQR)和包含后处理的预迭代算法.利用一个非接触式、多透射角度的成像系统进行圆柱仿体实验来评估上述3种方法,并与以往常用的
在基于映射的数据交换系统框架下,提出了一种本体辅助的模式匹配方法.它利用WordNet词汇本体和决策树学习相结合的方法进行属性名称匹配,构建数据类型本体计算属性数据类型的语
对表示复杂自然物体的纹元(texel)方法进行扩展,提出时变纹元的概念,以模拟草叶、毛发等自然物体随时间而变化的真实感效果.时变纹元内存储着自然物体随时间变化的纹元数据,从而可用于构建时变三维数据场,实现物体时变效果的模拟.采用一种纹元变形算法来生成时变纹元,该算法首先将基本纹元结构转化为点模型,然后对点模型进行动态模拟来生成时变数据,再将时变的点模型数据进行转化而得到时变纹元结构.运用时变纹元方
在创业教育受到普遍重视的形势下,中职学校的创业教育尚有办学理念、教材开发及创业心理教育等方面的问题.为此,应在树立创业教育新理念,加强学生创业心理品质的培养,开发创
针对数据简化中的实例选择问题,基于抗体克隆选择学说提出了一种免疫克隆数据简化算法.利用马尔可夫理论证明了该算法能以概率1收敛.通过对7个具有代表性的标准UCI数据集的简化
只有切实有效地进行中等职业教育的课程改革,优化课程结构,才能适应社会、经济发展的要求,促进中等职业教育的良性运行.