基于特征相关性的汉语文本自动分类模型的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:tangtang4211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。
其他文献
在航空航天、机械和土木工程等领域中,如果能对重要结构实施有效的健康监测,实时评估结构状况,将能有效保障结构的安全、可靠运行,避免重大事故的发生。结构损伤诊断技术是结
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
世界经济数字化转型是大势所趋,数字经济已经成为带动增长核心动力,尤其受新冠疫情影响增长放缓或负增长的情况下,抢抓数字经济发展机遇,推进供给侧结构性改革,推动高质量发
多域安全互操作为分布式资源和服务的最大共享创造了条件,越来越多的大规模分布式系统被划分成多个高度自治的管理域或安全域进行管理,从而优化系统性能,提高资源利用率。多域安
目前,大学英语语法教学的课时无法保证,英语教师对于语法教学的认知不同,且教学方式较为落后,这都使得英语语法教学效率较低。合作原则包括四个范畴,即量的准则、质的准则、
独立董事制度在发达国家已历时数十载,在我国的实践却刚现端倪,本文描述了我国独立董事实践,并就独立董事法律机理、目前法人治理结构中独立董事制度存在的桎梏,以及如何完善
日语中动名词较多,其中,汉语动名词占比最大。以日语中二字汉语与四字汉语语动词为研究对象,采用对比的方法,研究二者的不同。结果表明:二字汉语动名词由于项构造元素简单,其
本文在分析企业数据集成管理理论和企业信息系统中“信息孤岛”现象的基础上,以汽车车桥为例,在现代计算机网络环境下,研究了企业数字化集成管理,提出了企业3C技术数据面向产品的