基于语义网的文本信息分类技术研究

被引量 : 0次 | 上传用户:zhangbingcug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网上信息的大量增加,如果不依靠自动分类而完全通过手工进行文本分类,文本分类是不可能完成的。因此,文本自动分类成为一个重要的研究领域。而网络资源缺乏统一的语义描述,用户越来越难从海量的数据中查找到自己需要的资源,W3C组织倡导的基于本体的语义网技术为解决这一问题提供了出路,语义网通过获得词汇的语义使Web应用不但能够表示信息,而且能够理解信息,还可以在此基础上依据一定的规则对文本进行分类。在这篇论文中,我们首先介绍了语义网及其相关技术,然后介绍了Web文本分类的方法以及本体与语义网之间的相互关系,最后介绍了基于本体技术的语义网的自动分类器。此分类器可以对关于杜威十进制的分类法(DDC)和国会图书馆分类法(LCC)的文本进行分类。在介绍分类器的过程中,我们首先解释如何以模块化的方式构建本体,并把本体映射到DDC和LCC中。其次,我们正式定义了DDC-LCC之间和本体-分类表之间的映射。接着,我们解释了分类器使用本体进行分类的方法。最后,我们通过实验对分类器的精确性进行评估,实验结果证明我们的方法改善了分类的精确性,由于不完整的本体的使用,精确性改善的同时匹配率有所下降。
其他文献
<正>一、借助注释,读懂词意师:同学们,在王安石的眼中,乡愁是那一片吹绿了家乡的徐徐春风。而到了张籍的笔下,乡愁又成了那一封写了又拆、拆了又写的家书。那么,在纳兰性德的
植物内生真菌(endophytic fungi)是指在健康植物寄主的各种组织和器官内部或细胞间隙中度过全部或近乎全部生活周期而不使寄主表现任何症状的一类真菌。作者于2005年6月至2006
运用量子化学(QM)方法,计算研究了Fox-7与水、BTTN,HMX,RDX,CL-20与高分子粘合剂(AMMO,BAMO,HTPB,GAP,PEG,PET)模型物的分子间相互作用,讨论了上述超分子体系的结构与结合能,以及相互作
本文在大量阅读国内外相关资料的基础之上,从高速公路的属性分析出发,以公共产品和政府规制理论为基础,认真参考了国内外联网电子不停车收费的政策功能,并且认真分析了联网电
核电厂现场服务承包商和设备供应商是参与核电厂质量保证大纲实施的重要组成部分,质保部门根据核安全法规和导则的要求有计划有选择性的对承包商和供应商开展质保监查活动.结
果树重茬病又称再植病,是指在同一块地上,重复栽种同一种果树,而后茬果树生长受到抑制或病害发生严重,导致果品产量低、质量差的现象。目前,大多果农知道重茬栽植果树不好,但
随着国美、苏宁等家电连锁企业的兴起,家电厂商之间的矛盾不断激化,越来越多的家电制造商开始了家电分销模式的探讨,以特许加盟方式进入三、四级家电市场的TCL幸福树就是其中的
目的:建立注射用血栓通(冻干)中5-羟甲基糠醛的含量测定方法.方法:采用高效液相色谱法.色谱柱为Capcellpak C18柱(4.6 mm&#215;250 mm,5μm),流动相为甲醇-0.1%磷酸溶液(10:90);流速为0
<正>一、激情导课,创境诱趣师:今天我们来学习一篇童话故事,请同学们伸出手,和老师一起写写课题。(板书课题,边写边指导"路"字:"路"字左右结构,要注意左窄右宽,右边的横撇和
该文对脂肪醇聚氧乙烯(n)醚磺基琥珀酸单酯二钠盐 (n=3,5,7,9)的合成工艺和表面化学性能及应用性能进行了系统研究,并对反应物结构与其反应活性和产物结构与其表面活性的关系