【摘 要】
:
随着互联网上信息量的迅猛增加,语言学工作者研究的不断深入,如何在纷繁复杂的文献材料中,快速、准确地找到用户需要的信息,文本分类起着非常重要的作用。而其中,基于语义的
论文部分内容阅读
随着互联网上信息量的迅猛增加,语言学工作者研究的不断深入,如何在纷繁复杂的文献材料中,快速、准确地找到用户需要的信息,文本分类起着非常重要的作用。而其中,基于语义的文本分类逐渐成为主流,语义关系的最佳载体—本体,成为了学术界关注的焦点。本体就是对概念和关系的描述,基于本体的文本分类就是基于知识层面和语义层次上的分类。本文在论述语言学领域本体库建立并应用于文本分类意义的基础上,通过细致分析语言学内部词语之间的语义关系,构建了语言学文献的领域本体。提出了基于本体语义关系进行匹配的语言学文献分类方法。首先,利用已有的分词系统对文献进行分词处理和关键词抽取,采用经过一定改进的TFIDF算法,对文献关键词进行特征选择,确定待分类文本的特征项。然后将这些特征项与领域本体库中存储的领域特征项进行匹配,从而得到文本的类别。本文介绍了两种分类算法,一种是基于概念语义的匹配,种是非一致性模糊匹配。无论采取哪种算法,都可以在一定程度上弥补当前分类系统缺乏语义联系的不足,提高文本分类的准确性。
其他文献
目的探讨氨磷汀联合红细胞生成素治疗骨髓增生异常综合征(MDS)的临床疗效。方法对血液内科收治的MDS患者28例采用随机数字表法分为联合组和对照组各14例,对照组采用氨磷汀0.5
目的:对微创经椎间孔腰椎椎体间融合术与开放经椎间孔腰椎椎体间融合术治疗腰椎疾病的疗效进行系统评价。方法:由两位研究员独立检索Medline(1966-2012.6)、EMBASE(1966-2012.6)、
近年来,低毒环保的热固性不饱和聚酯树脂的研究受到了很大的关注。许多研究者尝试利用低毒或无毒的交联单体替代苯乙烯制备新型的环保不饱和聚酯树脂,但是此类不饱和聚酯往往耐
目的观察家庭干预作用下糖尿病患者身心变化情况。方法选取86例糖尿病患者,将其分为试验组和对照组,分别给予两组患者家庭干预和常规护理,评价两组患者出院时及出院后的心理
黄嘌呤氧化酶(xanthine oxidaseXOD)是嘌呤代谢中的关键酶,催化嘌呤氧化生成尿酸.以别嘌呤醇为阳性对照,通过测定尿酸生成量,比较酸立通降酸茶、鼠曲草和芦荟的煎煮液和提取液
五笔字型汉字索引法是对汉字索引方法的一次变革,它是采用汉字的拼形编码,并遵从人们的书写习惯顺序,以字根为基本单位来组成索引编码的一种方法。五笔字型汉字索引法分为单
文章通过介绍大路坪水闸安全鉴定组织与实施的过程,列出了复核计算的主要成果和安全鉴定结论,提出了除险加固的措施,不仅为大路坪节制闸随后进行安全加固奠定了基础,也为规范
在中国残疾人事业中有一支队伍,他们离基层残疾人最近,他们最了解残疾人的痛苦和需求,他们也最了解残疾人的家庭,甚至熟悉每个家庭成员,他们给残疾人提供了直接的服务,这就是
作为校本研究的有效载体,作为教师“理想自我”与“现实自我”心灵上沟通的桥梁,这些年,教育叙事研究在我国教育界开展得可谓是如火如荼,不但涌现出了数以万计的爱上教育随笔写作
由于多机器人协同控制在科学研究和工程领域中的广泛应用前景,多机器人协同控制系统在控制学领域成为一个研究热点。在多智能体一致性问题的相关研究中,设计一个用于评价算法