流形学习算法在中文文本分类中的应用

来源 :山东大学学报:工学版 | 被引量 : 0次 | 上传用户:zcznq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的流形学习局部线性嵌入(locally linear embedding,u正)算法通过欧氏距离来选择邻域,如果数据集选自多个类别,这种距离度量方法无法得到正确的邻域关系。本研究提出一种改进的局部线性嵌入(modified LLE,MLLE)算法,该算法通过改进距离矩阵,使得类间的距离大、类内的距离小,从而使得邻域的选择尽量在一个类中。将MLLE算法应用到中文文本分类中,结果表明:与传统的算法比较,MLLE在分类结果可视化效果和识别率等方面都有显著提高。
其他文献
钢框架与复合墙板通过一定方式进行连接,形成一种协同作用的结构体系,这种体系具有良好的抗侧力性能。为了研究不同连接方式对结构抗侧力性能及滞回性能产生的影响,设计了墙
针对数值模拟中求解几乎不可压缩材料时产生的体积锁定问题,提出了2种基于光滑有限元法的解决方案。方案1基于光滑子单元域有限元法,通过将材料特性矩阵划分为剪切部分和挤压
采用竖(斜)井纵向分段式通风的长大山岭隧道由于涉及隧道特点、交通状况、气象特征、环境要求等多种因素,对通风井与隧道相对位置如何确定目前还没有定论。基于计算流体动力
用M06/6-31+G*方法和PCM(polarized continuum model)溶剂模型研究了CnCu+/2+和CnZn2+配合物在气液两相中的稳定性顺序,重点从溶剂效应和电荷分布等方面讨论分析了与生物环境
研究了锂皂石颗粒对模拟聚合物驱采出水乳化稳定性能和油水界面性质的影响。通过分析含油量表征分析了锂皂石颗粒对聚合物驱采出水乳化稳定性的影响,发现在HPAM质量浓度为100
传统的物元模型用于水安全评价,当指标数较多时需要设计很多关联函数,设计和计算工作量皆很大,实际使用不便。为减少关联函数的设计并使之规范化,本研究提出了基于指标规范值
硫脲类三唑衍生物类化合物在农药创新中占有重要地位,为了揭示其结构与活性之间的关系,为新型杀菌剂的制备和筛选提供理论依据,本研究运用Gaussian 03程序,运用密度泛函理论(
为减小拍振现象对高速精密磨床电主轴加工精度的影响,利用磁悬浮轴承自身的传感器及数字信号处理部件,在不外加其他设备的情况下对电主轴中的拍振进行了观察实测。通过时域、
结合国家3号高速公路枣庄段中央分隔带绿化灌溉工程,试验研究了渗灌技术在高速公路中央分隔带绿化灌溉中的应用问题。进行了室内微孔渗管渗水性能试验和渗灌条件下土壤水分运
针对带有概念漂移的数据流的分类问题,提出一种新颖的能够识别并且适应概念漂移数据流的分类算法。该算法将原始数据流沿着时间轴划分为若干数据块后,选择第一块中有代表性的数