【摘 要】
:
传统多类文本多分类算法存在计算量大和训练时间长的问题,为此利用黄金分割(Golden Selection,GS)和支持向量域描述(Support Vector Domain Description,SVDD)对多类文本构造一种
【机 构】
:
西安电子科技大学计算机学院,西安石油大学理学院
【基金项目】
:
国家自然科学基金(61373174),陕西省教育厅自然科学基金(2010JK773),西安石油大学博士专项科研基金(Z10027)资助.
论文部分内容阅读
传统多类文本多分类算法存在计算量大和训练时间长的问题,为此利用黄金分割(Golden Selection,GS)和支持向量域描述(Support Vector Domain Description,SVDD)对多类文本构造一种分类算法。GS-SVDD首先利用词频逆向文件频率(Term Frequency-Inverse Document Frequency,TF-IDF)公式计算词条的相对词频,根据该值将词条降序排列,并对得到的文本向量进行归一化;其次采用黄金分割法对文本向量进行维数约简,使得冗余的样本特
其他文献
用免疫细胞化学和原位杂交技术探讨G、D细胞及胃泌素mRNA与肠化生的关系.标本来自胃镜活检的胃粘膜.结果显示,在与大肠化生区相邻的胃粘膜,G细胞突然消失,假幽门腺化生也缺乏
在智慧旅游视域下,满族非物质文化遗产随着时代的变迁出现了种种问题,亟待抢救。社会各界积极探索非物质文化遗产的现代生存模式,使非物质文化遗产能够在公众中重新活跃起来,
教学过程是师生交往互动过程,即对话过程。教学的对话性是其根本特征。因而,教师具备的良好的交际素养是教师素养中的必备素养。民族地区的民汉双语教师在教学生活中的交往互
基于野外露头、岩心、测井、录井、地震、生产动态等资料,结合断溶体地质成因,对塔河油田托甫台区奥陶系断溶体层级类型及表征方法进行研究。按照成因地质体的概念将断溶体划