【摘 要】
:
树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语
【机 构】
:
鲁东大学文学院山东省语言资源开发与应用重点实验室,北京大学计算语言学研究所,乐山师范学院智能信息处理及应用实验室
【基金项目】
:
国家863计划主题项目(2012AA011101);国家社科基金重大项目(12&ZD227);国家自然科学基金青年项目(61103089);山东省优秀中青年科学家科研奖励基金(BS2013DX020);鲁东大学人文社会科学研究项目(WY2013003)
论文部分内容阅读
树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。
其他文献
课外阅读是提升学生语文核心素养的必然之路。然而课外阅读在当前农村小学仍没有得到足够的重视,仍处于一种盲从、低效、零乱的状态。本文从引力不足,兴趣不浓等三方面剖析当
<正> 自从英国剑桥大学 Rose 等确定人体8种必需氨基酸以后,联合国粮农组织(FAO)和世界卫生组织(WHO)提出8种必需氨基酸模式标准,反映世界蛋白质工业水平,成为当今世界上两个
首先回顾了PON标准的各个方案和规范,然后着重介绍了XGS-PON标准以及XGS-PON与现有PON技术的兼容性设计和升级共存方案,最后对XGS-PON的发展进行了展望。
分析北部湾广西防城、北海、钦州三港地理位置相近、同属大西南便捷通道的出海口,存在重复建设、产业同构、内部竞争等现象,针对三港吞吐量之和仍低于相邻的湛江港且差距有进
花钱购买一羽赛绩傲人的鸽子代价太高,但是谁人不曾梦想拥有国家赛冠军鸽的子代,然而却又因财力不济而望鸽兴叹。为使高品质的赛鸽的价值能为大众所享有,人工授精不失为一个
通过对玻璃幕墙结构装配胶带在不同试验条件下90°剥离强度,正态拉伸强度、拉伸剪切强度、持粘性等性能的测试,表征了玻璃幕墙结构装配胶带的材料性能。并通过幕墙形式试验的
基于景宁惠明寺村和文成培头村等点面结合的畲村田野调查与畲族相关文献资料的彼此观照和相互印证,阐明畲族乡村发展路径与实践遵循着多元化的社区营造模式,并呈现出可资借鉴
京剧莎剧《王子复仇记》实现了京剧与莎剧之间的互文。这种互文性和改写表现在莎剧《哈姆雷特》的人文主义精神的主题在得到表现的基础上,实现了形式的替换与重塑,从而将现代
非正规就业作为一种新兴的就业形式,在缓解就业压力,促进经济发展和维护社会稳定等发面发挥了重要的作用。但是,我国现行的社会保障制度不适合非正规就业者,缺乏相应的社会保