汉语名词的定指性及其相关的句型

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xhbtbyrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
所谓名词的定指性问题,就是一个名词是“有定”还是“无定”的问题。不了解汉语名词的定指问题,就不能有效地抓住下列错句的症结,因此也不能有效地更正。我们先来看看一些错句的例子(按照惯例,本文中用星号表示有错。 在汉语教学中,尽管名词的有定与无定是一个很重要的问题,却很少得到重视。只是在讲到“把”字句的宾语时才提到一些,而且有些提法不很全面,甚至是错误的。
其他文献
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着力于对动词“像”的比喻义自动识别,首先,利用程序提取出语料库中带有动词“像”的句子,人工判断是否为比喻句;然后用CRF模型进行训练和测试,开放测试F值达到了83.3%,为隐喻计算的后续工作的展开奠定了的基础。
在构建领域知识库过程中,领域多词串比词携带了更多的语义信息,对于文本的主题分析和文本的内容分析明显的效果。本文首先利用C-Value方法从大规模无标注的真实语料中获取大量的多词串,然后采用Bootstrapping的机器学习技术,自动获取多词串的领域特征。实验结果表明,该方法有较好的性能,可以大大减轻人工构建的代价。
本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个特征,并使用最大熵模型对中文阅读理解问题回答进行了建模。考虑到语料库规模较小,以1:1的比例从CRCC语料库中随机选取了5组训练/测试集。在5组测试集匕的平均HumSent准确率达到75.46%。
在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型,并分析了该模型在LKB系统中的实现情况,总结了用LKB实现HPSG的优势与不足之处。
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法是有效的,开放测试结果F值达到了90.2%。
本文研究了基于基本块信息使用条件随机场模型(CRF)对汉语功能块进行自动标注的问题,针对词和基本块的两种不同的标注策略,将汉语基本块信息分别形式化成相应的特征,通过大量的特征组合优化实验,进行特征选择和模型参数估计。实验结果表明,在CRF模型中,基本块相关特征信息的加入可以大幅度地提高功能块识别性能。开放测试表明,在以基本块为单位的标注策略下,功能块自动标注的F值达到89.12%,这是目前最好的汉
本文提出了一种基于层叠条件随机场的CFN句法语义自动标往方法。该方法在低层条件随机场模型中解决了框架元素的识别,将识别结果传递到上层短语类型识别的条件随场模型,再将识别结果传递到上层句法功能识别的条件随机场模型,其低层模型为上层模型提供决策支持,并且在每层自动标注完成后,增加后处理规则去识别那些没有被正确标注的词语。实验选用CFN中“陈述”框架下的句子库,实现了基于层叠条件随机场句法语义自动标注的
1988年出版的《汉语水平等级标准和等级大纲》试行本,注意到了离合词的特殊性。其中词汇大纲采取的是一种折衷的办法,一方面把离合词作为词条整体列出,而不是作为两个单音词分列,但是另一方面,在拼音、词性的处理上仍然采取与短语相同的办法:“对于常用的动宾、动补结构,整体选人,不注词性。……如‘握手、跳舞’。而语法大纲则完全没有提及离合词。本文对此进行讨论。
笔者在十多年的对外汉语教学中,对学生学汉字以及使用汉字时出现的各种现象都比较关注。除了在专门开设的零起点汉字课上以外,在综合课、阅读课以及写作课的各种学生练习中,笔者发现学生的汉字错误中有相当一部分是由于汉字中的形似字造成的。联想到中国人自己,有时也会因形似字而犯错,语文高考当中有一项就是让学生辨别形近易误字。那么,汉字当中形似字的数量有多少?本文探讨这些形似字反映了汉字的什么特点?找出形似字的一
本文主要探讨“比”字句1-9类的偏误产生的原因,从表面上看来,这些好像是非常不同的偏误形式,但是实际上这些不同的语法点是相互联系、相互影响的一个体系。如同我们对语言体系一贯的看法,语言的变化不是局部的,而是整体的。当一个词汇的义项扩大,必然会有另一些相关词汇的义项在消减。当一个句式的功能在扩大,也必须有一些旧的句式的作用在退化。中介语体系也是如此。学习者的母语和他们刚刚习得的目的语的部分规则在冲撞