短语结构树库向依存结构树库转化研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：julian

【摘要】

：

汉语依存树库的建设相对其他语言如英语，在规模和质量上还有一些差距。树库标注需要付出很大的人力物力，并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法，将宾

【作者】

：

李正华车万翔刘挺

【机构】

：

哈尔滨工业大学计算机科学与技术学院信息检索研究室

【出处】

：

中文信息学报

【发表日期】

：

2008年6期

【关键词】

：

计算机应用中文信息处理短语结构树库依存结构树库依存句法分析 computer application Chinese information proc

【基金项目】

：

基金项目：自然科学基金资助项目（60675034.60575042）,国家863计划资助项目（2006AA012145）致谢王丽杰同学为本文的实验提供了汉语词性标注器,胡禹轩同学为本文提供了短语树的可视化程序,曹浩同学为本文提供了依存结构的可视化程序,在此一并表示感谢.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

汉语依存树库的建设相对其他语言如英语，在规模和质量上还有一些差距。树库标注需要付出很大的人力物力，并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法，将宾州汉语短语树库Penn Chinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构，从而增大现有依存树库的规模。将转化后的树库加入HIT-IRCDT，训练和测试依存句法分析器的性能。实验表明，加入少量经转化后的树库后，依存句法分析器的性能有所提高；但加入大量树库后，性能反而下降。经过细致分析．作为一种利用多种树库提高依

其他文献

知识增益：文本分类中一种新的特征选择方法

特征选择在文本分类中起重要的作用。文档频率（DF）、信息增益（IG）和互信息（MI）等特征选择方法在文本分类中广泛应用。已有的实验结果表明，IG是最有效的特征选择算法之一，该方法基于申

期刊

计算机应用中文信息处理文本分类特征选择粗糙集信息检索computer application Chinese information proces

死在转型路上的经销商

陕西省多位分销商和专营店客户突然发现，巧瑛公司发送的上海某终端品牌产品与要求完全不符，而且基本上全是滞销品，季节性旺销产品只占很．少比例。紧接着，巧瑛商贸公司的电话打不通

期刊

经销商转型品牌产品化妆品市场陕西省季节性

酱油生产中如何提高氨基氮生成率

<正> 成品酱油的理化质量指标中,氨基氮和全氮这二个项目都是属于主要指标的内容,二者必须符合质量规定指标才能报产与成品出厂。我们在实际工作中,酱油配兑时往往遇到氨基氮

期刊

酱油氨基氮生成率

藏语语料库词语分类体系及标记集研究

青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1000万字的藏语语料库的加工实验，加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。

期刊

计算机应用中文信息处理语料库藏语词语分类体系标记集computer application Chinese information process

萃取剂对不溶性硫制备的影响及工艺条件优化

以升华硫为原料采用熔融法制备了不溶性硫（IS），考察了不同萃取剂对IS的萃取效果并与CS2的萃取效果进行了比较，同时，以硬脂酸钙为稳定剂优化了IS的聚合条件，比较了不同急冷方式对IS

期刊

熔融法不溶性硫环己烷硬脂酸钙高距离垂撒急冷rapid cooling of sulfur melts insoluble sulfur cyclo

短语结构树库向依存结构树库转化研究

其他学术论文