语料标注相关论文
汉语学习者依存句法树库为非母语者语料提供依存句法分析,对第二语言教学与研究,以及面向第二语言的句法分析、语法改错等相关研究......
针对军事指挥控制保障领域各种技术数据资料挖掘处理和融合应用效率低下的问题,提出利用知识抽取技术获取关键知识及其相互关系,形......
"全球汉语中介语语料库"(1)是因应汉语作为第二语言教学的学科建设和科学研究的需要而设计建设的一个迄今为止规模最大的汉语中介......
篇章分析系统性研究的开展依赖于大规模高质量的标注语料.现有标注语料以纯手工标注和单机辅助标注为主,难以满足标注效率和语料质......
本文介绍了一个面向术语定义识别的术语释义信息标注语料库和针对语料库建设所开发的辅助软件系统。语料库建设工作包括原始语料收......
现有的文本分类方法需要较大的训练语料,在训练语料足够大的前提下可取得不错的效果,训练语料的规模直接影响分类的效果.然而,要大......
本文利用中科院计算所ICTCLAS系统对《人民日报》1998年1月语料进行标注,并与北京大学免费发布的《人民日报》1998年1月标注语料进......
由于地质矿产文本中含有大量的专业术语,通用领域方法无法很好识别其未登录词,而其他特定领域中文分词方法移植性较差,不适用于地质矿......
研究并提供了一种人工智能认知智能领域的语料标注方法和系统.根据预设的算法模型对待标注语料集进行标注,基于标注结果生成对应的......
针对渔业标准实体关系抽取任务中存在重叠关系导致的效果不好问题,提出了基于双重注意力机制的实体关系抽取方法。首先,提出了一种......
语料库语言学是当代计算学语言学中经验主义方法论取得显著成效从而在计算语言学领域占有一定的优势地位的新学科方向。语料库不仅......
随着科学技术的发展,大数据时代的到来,句法分析在自然语言处理任务中所扮演的角色越来越重要。但是从近几年的句法分析发展程度来看......
随着中国互联网用户的爆炸式增长,中文信息处理技术在互联网领域受到越来越多的重视。中文组块分析,因其在具有词法分析效率的同时又......
近年来,随着博客、电子商务、社交网站与微博等信息平台的兴起,主观性文本的信息量迅速膨胀。为了自动分析这些主观性文本包含的观......
对于社交媒体平台而言,识别和标注出特定语言的文本对于情感分类、趋势提取、预测电影评分等研究都具有重要的现实意义。传统的语......
面向任务的对话系统是智能问答系统最热门和最有应用价值的子领域之一,而面向任务的对话系统需要大量的标注数据进行训练,数据标注......
随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑......
聋人汉语书面语语料库建成后,基于语料库的聋人汉语书面语研究,将在字、词、句、篇诸方面得到发展。随着对聋人汉语书面语研究的深......
本文研究开放式中文命名实体识别问题。针对传统命名实体识别方法具有训练语料标注困难,自适应能力不强等缺点,研究人员提出了开放式......
在语料标注中,我们发现“作”与“作为”在句中的用法比较复杂,在做动词和做主语义块标识符时尤其不好分辨。在分析了大量语料后,我们......
HNC语料库以HNC理论模式为指导、以句子为标注的基本单位对语料进行自上而下的语义标注。XML的易读性、易检性、层次性、扩展性等......
本文分析了当前国内语音语料标注结果的存储结构的局限,不但从理论上分析了关系型数据库在设计语音语料库存储结构方面的优势,提出......
本文介绍了作者在人民日报标注语料库分析上的一些经验,提供了相关的研究结果.采用统计技术对熟语料库进行研究,其目的是为了汉语......
本文以七个现代汉语文本语料库为研究对象,考察了现代汉语文本语料库的建设现状,分析了各语料库在语言研究中的使用率、应用方向、......
中国文化博大精深,汉字的发展在中国更是有着几千年的辉煌历史.在历史的发展进程中,以汉字形成的中文篇章往往以句间语义关系的复......
语料库是语言学研究和自然语言处理研究的基础资源,随着计算机技术的高速发展,计算机存储和处理语料的能力愈来愈强,语料库在语言......
文本作为最常用的一种自然语言的载体,是一种重要的原始空间数据来源,蕴含了大量的GIS(地理信息系统)空间查询信息。从文本中获取......
自然语言是人类空间认知结果的主要表现形式,文本即是人类最常用的一种自然语言,也是一种重要的原始空间数据来源。从文本中获取未......
对英语副词“again”的个体研究侧重语义层面且成果颇丰;而对其句法层面位置的分类和特点未作深入探索。本文在认知语法框架的主观......
摘要:作为一项重要的基础资源,双语平行语料库在人工智能领域的研究起着举足轻重的作用。我国涉及少数民族语言的双语语料库的探索工......
基于语料库的电脑辅助翻译教学目前大多采用词性标注、句法标注、语义标注以及词频计算、词汇检索、词语搭配等基于词汇语法范式的......
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则......
本文简要介绍了国内满文(锡伯文)信息处理现代化技术方面的有关情况.例如:满文操作系统,锡伯文、满文字处理软件系统,满汉文机器翻......
语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据......
笑话作为国家级非物质文化遗产,历史悠久,普遍存在于人们的日常生活中,是最贴近人们生活的艺术体裁之一,笑话的理解也是人工智能发......
作为一项重要的基础资源,双语平行语料库在人工智能领域的研究起着举足轻重的作用。我国涉及少数民族语言的双语语料库的探索工作相......
为了辅助进行产品评论中特征-观点对识别的挖掘工作,对细颗粒度产品评论语料库的构建技术进行了研究.介绍了用于产品评论细颗粒度......
口语语料库与书面语语料库相比发展速度慢,因为口语语料库必须把有声材料转写成文本材料,还要进行语音和错误标注,难度要比建立书......
笔者针对口语练习中存在的问题展开分析和研究,提出了口语练习中语音特征提取系统研究。采用MALTAB对语音信号提取进行倒谱分析,提......
建立个性化语料库有助于学生顺利地确定毕业论文选题、进行研究和完成撰写任务。学生建立毕业论文写作个性化语料库应当在教师指导......
摘 要:篇章关系(Discourse Relation)是篇章语义分析的重要内容,本文在英文篇章关系研究的基础上分析了中英文间的差异,总结了中文篇章......
目的:开展基于主动学习的中文电子病历命名实体识别研究,旨在优化机器学习模型,并降低标注成本。方法:分析比较信息熵、语料长度以......
针对高表现力情感语音合成的需要,设计并建立了一个具有四种情感状态(正常、喜悦、忧伤、愤怒)的高表现力情感语料库.该数据库包含10......
汉蒙对照双语语料库是建设综合型语言知识库的有机组成部分,又是基于实例的机器翻译系统的基础。因为双语语料库中包含两种语言互译......
语料库作为一种即时高效的辅助手段,已经被广泛地应用于外语及翻译研究中,并且取得了丰硕的研究成果,但是如何利用语料库来辅助翻......
篇章句间关系(Discourse Relation)是篇章级语义分析的重要内容,该文在英文篇章句间关系研究的基础上分析了中英文间的差异,总结了......