基于语料库的能够独立成句的一词结构和三词结构研究

被引量 : 0次 | 上传用户：initial1985

【摘要】

：

能够独立成句的一词结构和三词结构作为特殊的语言现象,存在于各种汉语文本中,有一定的研究价值。本文所做的工作,主要是对大规模中文语料库文本中能够独立运用的一词结构和

【作者】

：

褚红伟

【发表日期】

：

2014年期

【关键词】

：

语料库统计一词结构三词结构类型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

能够独立成句的一词结构和三词结构作为特殊的语言现象,存在于各种汉语文本中,有一定的研究价值。本文所做的工作,主要是对大规模中文语料库文本中能够独立运用的一词结构和三词结构进行分类统计和结构分析,这些都是在对语料库文本分词与词性标注的基础上进行的。本文的结构内容设计共分为五章：第一章,是对语料库的发展进行概述,简单介绍了语料库的国内外发展情况,介绍了本论文的选题缘由、研究目的、意义和内容结构设置。第二章,首先对汉语词语切分的基本定义做了简要概括,再介绍汉语词语切分的难点以及切分效果的评价。以此为依据,来证明本文运用的词语切分工具的切分准确率是比较高的,可以忽略语料库文本词语切分中的一些噪音。第三章和第四章为论文的主要部分,这两部分是通过几个实验来得出结论的。第三章抽取测试文本中夹在两个中文标点之间的能够独立运用的一个词语的结构,按照词频统计数据得出独立成句的结论,然后对这些词语进行分类,得出能够独立成句的词语所属词类所占的比例,再通过计算各成句词语所属词类独立成句的条件概率,计算出不同词类的词语在实际应用过程中独立出现的次数与总共出现的次数的比值。判断出哪类词语被独立运用的概率高。第四章实验步骤与第三章相似,抽取小规模测试文本中的夹在两个中文标点之间的能够独立成句的三个词语的结构,绘制相应的词表,并计算各个词条的t-测试值,设定阈值判断出三个词语中的中间词更倾向于同前、后两个词中的哪一个先结合,划分出(A+B)+C和A+(B+C)两种类型。最后再对这些能够成句的三词结构进行结构类型的划分。通过统计的方式判断出哪种结构类型的三词结构更容易被独立运用。第五章为总结与展望,对本论文的两大主要章节得出的结论进行总结,并对本论文未完成的工作以及对将来的进一步研究进行介绍。对大规模的语料库进行中文信息处理之后发现,能够独立成句的高频词和中频词,在文本中出现的次数越多,能够独立成句的机会越大。而低频词部分随着在测试文本中出现次数的减少,能够独立使用的机会基本不变。另外,还得出大部分实词是可以独立成句的,虚词中只有少量的词类能独立成句,但是实词中的名词、动词、形容词等更多的是同其他成分组合构成句子,相对来说独立成句的机会不是很大。相反,虚词中的拟声词、叹词等,独立出现次数虽然很少,但是,它们在文本中出现的总次数也不多,它们独立使用的机会相对来说比较大。三词句在组合形式上有(A+B)+C与A+(B+C)两种,在一定的阈值范围内可以通过t-测试值来确定三词结构在形式上属于哪一种类型。超出一定阈值范围内的结构,不能仅仅凭借t-测试值来判断,要根据具体的词条来确定其类型。另外,从句子结构上来看,三词句多以主谓结构、动宾结构和偏正结构形式出现。

其他文献

我国税务诉讼证据制度研究

20世纪70年代以来,世界范围内的纳税人权利保障运动日益高涨,尤其是税务诉讼制度,在保障纳税人合法权益方面作用越来越大。跟随此历史大潮,我国税务诉讼制度也在近20年得到了

学位

税务诉讼证据举证责任证明标准举证时限

管理者风格对我国上市公司投融资决策影响的实证研究

传统经济学文献对于企业投融资决策的研究一般围绕市场、行业、企业层面来展开，往往遵循新古典经济学的理论，而忽视了对管理者这一微观主体的研究。伴随行为金融学不断发展，很多

学位

管理者风格上市公司投融资决策

高速公路服务区连锁便利店经营管理优化对策

高速公路当前已经成为了人们出行的重要选择,在很大程度上增强了人们出行的便利性,其中高速公路服务区是高速公路重要附属设施,对于确保高速公路正常运行起关键作用。现从高

期刊

高速公路服务区连锁便利店经营管理

黄山风景区旅游公共服务满意度与优化研究

现代旅游市场游客结构的变化,旅游的消费水平、产业规模和社会功能的不断提升,使传统的旅游接待服务已经不能满足蓬勃发展的个性化旅游市场的增长需求。为了满足旅游业发展需

学位

旅游公共服务供给需求游客满意度结构方程

紫草油治疗龟头、冠状沟等处的糜烂渗出9例报告

<正> 龟头、冠状沟、阴茎等处的糜烂渗出多见于固定红斑型药疹,常伴有少量渗出以及瘙痒、摩擦疼痛等,严重地影响日常生活和工作。由于部位特殊,给护理和治疗造成了困难。过去

期刊

冠状沟紫草油

谈如何提高施工企业的安全文明施工水平

对安全文明施工的重要性进行了论述,并分析了安全文明施工管理存在的问题,针对这些问题提出了施工企业提高安全文明施工的建议,总结了施工现场管理及安全文明施工经验,以期使

期刊

安全文明施工管理施工水平制度

对建筑工程领域中意外伤害险的一些思考

为保证施工人员的安全以及建筑企业、施工单位等相关各方的切身利益,对施工过程中建筑意外伤害险出现的一些问题进行了分析,提出了修改完善相关法律法规与建筑企业合规经营生

期刊

建筑工程工人意外伤害险

肝肾同治法治疗眩晕的体会

肝肾同源 ,肝血与肾精在生理上相互滋生 ,病理上相互影响 ,肝肾阴虚可导致眩晕。本文从肝肾同源出发 ,论述了肝肾同治在眩晕病中的具体运用 ,并举临床病例加以说明 ,进行了有

期刊

眩晕肝肾阴虚肝肾同治中医药疗法

图书去库存化方式初探

文章对我国图书的高库存现状进行了量化描述，通过数字体现问题的严重性与紧迫性，同时认为供求脱节、跟风出书以及经销包退制是导致高库存问题的主要原因。本文指出出版社应从前

期刊

图书库存选题策划营销机构去库存化

日本教育基本法的修改与其“教育宪法”地位探讨

日本的教育基本法是理念法,具有"教育宪法"的地位。进入21世纪后,日本政府和教育再生会议大力推动,教育基本法得以全面修正和实施。新教育基本法脱离了旧法"教育中立"的基本

期刊

日本教育基本法修改政府施政教育宪法

基于语料库的能够独立成句的一词结构和三词结构研究

与本文相关的学术论文