【摘 要】
:
框架元素标注是中文FrameNet众多任务中亟待解决的一个问题,目前仍主要采用有监督的机器学习方法,即依赖大规模人工标注的例句作为训练语料。但例句标注又是一件费时费力的工
【机 构】
:
山西大学计算机与信息技术学院,计算机智能与中文信息处理教育部重点实验室
【基金项目】
:
国家自然科学基金(61373082), 山西省科技基础条件平台建设项目(2014091004-0103), 山西省回国留学人员科研资助项目(2013-015), 国家863计划项目(2015AA015407), 中国民航大学信息安全测评中心开放课题基金(CAAC-ISECCA-201402)
论文部分内容阅读
框架元素标注是中文FrameNet众多任务中亟待解决的一个问题,目前仍主要采用有监督的机器学习方法,即依赖大规模人工标注的例句作为训练语料。但例句标注又是一件费时费力的工作,所以为了降低人工标注的代价,该文将主动学习应用到框架元素标注中,优先选择训练模型预测最不准的例句交由人工标注。该文以条件随机场为标注模型,并提出了进行样本选择时所依赖的准则。实验表明,一方面,与随机选择样本进行标注相比,当使用相同数量的例句训练模型时,主动学习使框架元素标注的性能最高提升4.83%;另一方面,主动学习使框架元素标注达到
其他文献
<正>Dear Editor,The packaging of viral genomic RNA into virus par-ticles is a critical step for virus maturation.This stepincludes the recognition and interacti
领域自适应研究的目标是建立一种动态调整翻译模型,使翻译模型对目标领域的语言特征具备较强的学习和处理能力,借以保证翻译系统在不同领域获得平衡可靠的翻译能力。现有翻译
Dear Editor,Prototype foamy virus(PFV)belongs to the genus Spumavirus in the Spumaretrovirinae subfamily of Retroviridae.Although PFV and HIV have much in commo
Hepatitis B virus (HBV) biosynthesis is primarily restricted to hepatocytes due to the governing of liver-enriched nuclear receptors (NRs) on viral RNA synthesi
中共中央政治局近日就维护国家金融安全进行第四十次集体学习。习近平总书记在主持学习时强调,金融安全是国家安全的重要组成部分,是经济平稳健康发展的重要基础。
提出了一种基于神经网络的中文分词方法,以提高分词系统向新领域迁移的适应性和灵活性。该文方法采用了对现有分词器分词结果进行纠正的思路。这种基于纠正的两阶段方法与分
Coxsackievirus A16 (CVA16 ) ,和 enterovirus 类型 71 (EV71 ) ,全球为手,脚和嘴疾病(HFMD ) 的大多数盒子负责。最近的调查结果建议在 CVA16 和 EV71 之间的再结合,和这二个病
夜的/梦总有/天空因为/奔跑 踏着的色彩 跟着/影子
目的探讨原发性肝癌(PHC)的发生与乙肝病毒(HBV)感染之间的关系.方法采用放射免疫法对福建泉州地区220例原发性肝癌患者、220例良性肝病患者与295例健康人群进行血清HBV标志
许多 flaviviruses 是引起可观的疾病负担的重要人的病原体,包括脑炎和出血性的发烧,在他们是地方性的在区域。为 flaviviral 感染的处理的少量在指向对 flavivirus 复制必要的