短语结构树库向依存结构树库转化研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:julian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库Penn Chinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IRCDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析.作为一种利用多种树库提高依
其他文献
特征选择在文本分类中起重要的作用。文档频率(DF)、信息增益(IG)和互信息(MI)等特征选择方法在文本分类中广泛应用。已有的实验结果表明,IG是最有效的特征选择算法之一,该方法基于申
陕西省多位分销商和专营店客户突然发现,巧瑛公司发送的上海某终端品牌产品与要求完全不符,而且基本上全是滞销品,季节性旺销产品只占很.少比例。紧接着,巧瑛商贸公司的电话打不通
<正> 成品酱油的理化质量指标中,氨基氮和全氮这二个项目都是属于主要指标的内容,二者必须符合质量规定指标才能报产与成品出厂。我们在实际工作中,酱油配兑时往往遇到氨基氮
青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。
以升华硫为原料采用熔融法制备了不溶性硫(IS),考察了不同萃取剂对IS的萃取效果并与CS2的萃取效果进行了比较,同时,以硬脂酸钙为稳定剂优化了IS的聚合条件,比较了不同急冷方式对IS