基于特征项扩展的中文文本分类方法

来源 :应用科技 | 被引量 : 0次 | 上传用户:asdfghjkb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.
其他文献
<正> 1 前言 大直径钻孔灌注桩由于承载力高、施工简便、适应性强、造价经济等优点,在杭、甬、温等软土地基的工程实践中应用得越来越多。但由于其是在地下开孔灌注成桩,因而
1 工程概况嘉兴一中风雨操场为单层现浇钢筋混凝土框架,层高10.2m,屋盖采用后张有粘结预应力现浇钢筋混凝土井式梁板,平面尺寸为37m&#215;21m,柱距3.7m(图1).
在《科学》教材中,生命科学领域的内容占了很大的篇幅。如何把握好这部分教学内容,在课堂中更好地引领孩子去探究,培养孩子的科学素养,是一个值得研究的课题。笔者认为,在教学这部