【摘 要】
:
目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未
【机 构】
:
哈尔滨工业大学计算机学院社会计算与信息检索研究中心
【基金项目】
:
国家自然科学基金重点项目(61133012);国家自然科学基金资助项目(60803093);国家863重大项目(2011AA01A207);核高基重大专项(2011ZX01042-001-001);哈尔滨工业大学科研创新基金(HIT.NSRIF.2009069);中央高校基本科研业务费专项资金(HIT.KLOF.2010064)
论文部分内容阅读
目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未标注语料,该文将主动学习应用到中文依存句法分析,优先选择句法模型预测不准的实例交由人工标注。该文提出并比较了多种衡量依存句法模型预测可信度的准则。实验表明,一方面,与随机选择标注实例相比,当使用相同数目训练实例时,主动学习使中文依存分析性能最高提升0.8%;另一方面,主动学习使依存分析达到相同准确率时只需标注更少量实例,人工标注量最多可减少30%。
其他文献
纳税筹划是企业在合法的前提下,通过对经营事项的事先筹划、选择和管理,追求税收负担最小化的经济管理活动,有助于实现企业价值最大化。鉴于煤炭企业的特点,就煤炭企业税收筹
彞族服饰类型及其审美特色[云南]龙倮贵(族)一丰富多采的服饰类型彝族,由于历史上形成了大分散小聚居和大杂居小分散,支系复杂,称谓庞杂,政治经济发展不一,于是形成服饰种类繁多,色彩纷
<正>满族是我国北方一支古老的民族。在漫长的岁月里,满族先民生息、繁衍、活动在祖国东北地区的“白山黑水”之间,同时,也创造了自己绚丽多彩、光辉灿烂的民间文学。 民间
《乐府指迷》是南宋末季沈义父撰写的一本词学理论著作。本书对于我们寻绎宋人词论中一些基本看法,认识南宋末季词坛风气趋向,把握南宋末季格律词人的创作倾向,探寻南宋格律
真空玻璃是一种新型节能玻璃,在提倡控制建筑能耗、低碳环保、节能减排的城市建设中有着广泛的应用。本文阐述了真空玻璃的结构和节能原理,在此基础上对真空玻璃的传热机制进
人防地下室是我国当前民用建筑中发展比较快的一项工程,它具有平时和战争两用的过程,在施工建设时应该要重视其施工质量,这样才能够更好的发挥人防地下室的作用。但是一些施
<正> “人力资本”理论产生于本世纪50年代中期,诺贝尔奖金获得者,美国著名经济学家西奥多·W·舒尔茨是这一理论的始作俑者。战后,随着西方社会经济的不断增长,出现了许多用
应用 3S技术对天津湿地环境进行调查 ,结合地面采集的历史和现状数据 ,全面分析了天津湿地环境变迁的自然和人为因素。近一个世纪以来 ,天津湿地持续减少 ,天然湿地丧失殆尽
传统吉祥图案历来主要是被作为"美术"来理解的,本文则从民俗学角度论述了吉祥图案作为"民俗资料"的意义。笔者认为,传统吉祥图案从其历史流脉来看有明显的传承性特点,是一种