【摘 要】
:
语料库是自然语言处理中用于知识获取的重要资源。本文以句子理解为出发点 ,讨论了在设计和建设一个基于语义依存关系的汉语大规模语料库过程中的几个基础问题 ,包括 :标注体
【机 构】
:
清华大学电子工程系,清华大学计算机科学与技术系
论文部分内容阅读
语料库是自然语言处理中用于知识获取的重要资源。本文以句子理解为出发点 ,讨论了在设计和建设一个基于语义依存关系的汉语大规模语料库过程中的几个基础问题 ,包括 :标注体系的选择、标注关系集的确定 ,标注工具的设计 ,以及标注过程中的质量控制。该语料库设计规模 10 0万词次 ,利用 70个语义、句法依存关系 ,在已具有语义类标记的语料上进一步标注句子的语义结构。其突出特点在于将《知网》语义关系体系的研究成果和具体语言应用相结合 ,对实际语言环境中词与词之间的依存关系进行了有效的描述 ,它的建成将为句子理解或基于内容的信息检索等应用提供更强大的知识库支持。
其他文献
目的了解成都市地铁X射线行李包检查系统放射防护状况,为保障安检工作人员和公众的健康与安全提出对策依据。方法使用451P X-γ巡测仪,在成都市各地铁入口按照《X射线行李包
“礼”作为中国古代社会的道德与法律的重要表现形式,它的运作过程全面体现了中国传统法律文化的精髓。“礼治”的基本内涵是建立具有道德内涵的礼仪制度,并通过礼仪制度确立
目的了解深圳市宝安区疾病预防控制中心艾滋病自愿咨询检测(VCT)服务利用情况以及探讨HIV感染的影响因素,为控制艾滋病传播提供科学依据。方法收集2012年1月至2016年9月深圳
浅谈高校工会文体工作的功能王莫离文体活动是现代社会人们生活中不可缺少的部分,是社会主义精神文明建设的重要内容。作为高校工会来说,就担负着组织和指导全体教职员工积极地
研制和开发临床信息系统是建立高质量医院信息系统的重要基础和组成部分。通过开发临床信息系统过程中的体会,提出应该注意的问题:(1)数据格式;(2)数据的获取、显示和分析;(3
人机交互设备是指人通过某种装置操纵控制一台机器或一个设备系统的专用机具,包括鼠标、操纵杆等。该文介绍一种广泛应用于高可靠性要求场合的运动载体操控中的操纵杆,该操纵
我国饮食文化博物馆具有"数量增加快、区域聚集性强、主体多元与种类丰富"的特点。饮食文化博物馆的功能体系由"基础层面——传承传播饮食文化、拓展层面——促进推动美食产
老舍的悲剧小说在情节结构、悲剧观念、叙事技巧等方面,与英国作家哈代有较多的相似,这种相似可能有向西方悲剧文学学习借鉴的原因,但也源于老舍自己独特的对社会人生的体验
在传统的职校教育中,班主任作为核心教育者和管理者,工作压力大、任务重,常常会力不从心,学生的大部分课余时间被各种娱乐项目占据,专业课老师无法及时跟进学生的复习与预习,
目的探讨急性中毒患者的急救与护理。方法回顾性总结1例"藜芦"中毒患者的发生过程和急救、护理方法。结果病人误食"藜芦"后出现胃部烧灼感,呕吐大量胃内容物,胸闷,心悸,气短3