基于潜在语义索引和遗传算法的文本特征提取方法

来源 :情报科学 | 被引量 : 0次 | 上传用户:winterryliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文采用潜在语义索引(LSI)和遗传算法(GA)进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM(Vector Space Model)中,通过奇异值分解(SVD,Singular Value Deccvaposition)可以有效地降低向量空间的维数,但通过维数约简后的文本特征仍要保持在数百维左右,因此本文采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大的降低文本向量空间的雏数,并能提高分类准确率。
其他文献
<正> 本世纪五十年代发现的5-羟色胺(5-HT),由于其受体进一步被分成不同的亚型而再度受到重视。已发现对该受体亚型有选择性的激动剂和拮抗剂5-HT和5-HT能药物与类癌瘤综合症
创新是引领发展的第一动力,创新驱动发展战略是我国实现转型发展、建成现代化强国的重大战略。创新生态系统是以生物学隐喻的方式研究形成的创新系统范式,被看作是创新3.0时
目的对现行天花疫苗和天花疫苗的研究进展进行综述,为天花疫苗的研究和应用提供参考。方法通过查阅近年来与天花疫苗有效性和安全性研究相关的国内外文献,进行归纳总结。结果
结合工程实例,利用有限元分析软件Midas/civil分别建立了考虑和不考虑桩土作用的两种连续梁桥有限元模型,并对比分析了地震荷载作用下两种模型的动力响应,得出考虑桩土结构相
提高水泥石性能的有效方法之一是限制微裂纹扩散。本工作研究了一种新型纳米纤维材料CaSO4晶须,实验结果表明,加入CaSO4晶须能够提高水泥的抗压、抗折强度。同时对水泥的微观