基于同义词词林和《知网》的短语主题提取

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:fado
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.
其他文献
为了对预混火焰在平板狭缝中熄灭的内在规律进行探讨,给出了火焰在狭缝中熄灭状态的判断依据.通过模拟甲烷/空气预混火焰在平行板狭缝中淬熄的机理及过程,借助实验和计算在特
采用水热法合成了一例由Anderson型铬钼酸构筑的有机无机杂化材料:(H3O)3{Cu2(H2O)2(4-ptz)4[Cr(OH)6Mo6O16]}.用单晶X射线测定其晶体结构,该晶体属三斜晶系,空间群P-1.晶胞参数α