文本语料库相关论文
知识图谱问答(KGQA)是给定自然语言问题,对问题进行语义理解和解析,进而利用知识图谱进行查询、推理得出答案的过程。但知识图谱通常是......
一、语料本文的电视足球解说节目包括2007年9月前后上海东方台“五星体育”播出的女子世界杯足球比赛、2007年9月前后的央视5套及2......
在1998年8月的应用语言学研讨会上,我提交的论文《关于大规模真实文本语料库的几点理论思考》,对语料库的建设进行了反思,在回顾多年来语料......
为构建大规模中文文本语料库,提出了一种简单、有效、通用的中文Web主题文本提取方法。该方法巧妙地利用中文文本长度和标点符号序......
利用BRAT标注工具及人工标注方法,根据初步制定的文本语料标注规范,按照语料选择、语料预处理、语料标注、标注校对、一致性检验的......
大连理工大学软件学院日语实验室创建的日语文本语料库JTCH(Japanese Text Corpus Handler)利用sen日语分词技术,以NHK、朝日新闻为......
文本语料库是文本数据挖掘的基础。很多文本语料库来源于生产生活的实际工作中,通常由行业专家为其定义类别。本文的数据集来源于......
本文对于语料库的建设和建设中的相关问题进行了一些反思,从普通语言学、社会语言学的角度,思考了一些与句法、语义、语用相关的理论......