基于特定领域本体的术语扩充方法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:backaroo2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会各学科知识的剧增,各种新知识,新术语层出不穷。为了适应对于领域词典的编写要求,从浩如烟海的科技文献中找到领域相关的新术语,本文提出了一种基于领域本体的新术语扩充方法。该方法可作为领域专家收录领域术语的重要辅助手段。本文介绍了中外关于术语识别,术语扩充的相关工作,总结了传统的基于统计特征和基于规则的方法。给出术语扩充的指导原则,并结合传统方法,提出一种基于领域本体的术语扩充方法。该方法计算出词语在文档中的影响,使用领域本体来体现领域知识,通过在文档中识别出的本体中概念来计算文档及词语的领域相关度,通过本体概念匹配结果统计文档及术语相关类别,最终获得术语候选项的推荐排序,可以对术语候选项推荐结果进行优化。设计实验及提供结果分析,说明该方法的有效性和可行性,同时给出了这一工作的总结和展望。
其他文献
随着个人媒体设备的快速普及和互联网技术的出现,现实生活中图像的数量急剧增长,因此如何快速有效地组织和管理这些图像成为一个研究热点。与此同时,各种新兴技术的迅速发展
恶意代码作为信息技术的衍生物,对网络安全领域的威胁日益严重。恶意代码分析工作具有十分重大的意义。通过对恶意代码运行机制的深入挖掘可以获得其内部详细信息,进而作为恶
随着经济的发展,企业内部以及企业之间日益膨胀的企业活动需要工作流技术的支持,因此对工作流系统的可用性、灵活性、效率性、安全性提出了更高的要求。企业不仅需要一个能够定
进入二十一世纪,现代科技的发展正推动着各行各业的革新。教育事业作为立国之本,也在科学技术的推动下,产生了巨大的进步。现代社会的学习形式发生了很大的变化,我们正从单一的课
由于国内宽带网络的出口带宽瓶颈和服务器处理能力的限制,传统的基于C/S模式的流媒体分发系统,为了支撑不断扩张的客户群,需要购买越来越多的服务器硬件和带宽资源,从而导致
随着网络的高速发展,越来越多的实时业务在网络中传输,这些业务对数据传输的带宽、延时、抖动都有更高的要求。服务质量QoS成为研究的热点。QoS的研究目标是有效地为用户提供
学位
近年来随着各个行业数据量的大幅度增长,如金融,电信行业等,使得存储费用和管理费用也随之增长。面对信息量不断膨胀的问题,数据库系统采用压缩数据的方法保存数据,同时为了提高压
随着互联网技术的高速发展,网络信息量也随之飞速增长,如何从海量的信息中搜索出用户需要的信息成为当前热门的研究课题,搜索引擎作为互联网信息检索技术得到了广泛的应用,垂
近年来,广东省高中阶段招生报名和录取都是通过网上进行,本人曾经参与了广东省高中阶段招生报名服务平台(中考平台)的开发与设计。通过对中考平台中获得的数据进行分析,发现
随着计算机嵌入式芯片的应用发展,当今的信号及图像处理需要大量的浮点加、减、乘、除操作,而浮点数系统本身的复杂性决定需要专用的硬件来实现浮点操作。浮点运算器的性能影