切词相关论文
【目的/意义】跨语言信息检索研究的目的即在消除因语言的差异而导致信息查询的困难,提高从大量纷繁复杂的查找特定信息的效率。同......
以出版刊物的电子排版文件为数据资源,自动建立了《精细石油化工文摘》数据库.阐述了建库过程中的中文自动切词、中文校对、自动标......
本文详细探讨了自动分词和词性标注软件评测工作中的分词单位确认、兼类词表的建立、人名、地名识别和评测软件的编制等多方面的技......
本文深入研究了HTML标记对网页内容的修饰作用,并对大量网页的结构进行了分析,通过对比各种中文文档的索引和加权策略以及中文切词、......
一 引言中文文本自动切词是中文信息处理的一项重要的基础性工作。中文信息处理的很多项目中都涉及到切词问题 ,如汉外机器翻译、......
“一个人的语言修养,是构成他的语言风格的各种因素中最活跃的一个因素。任何一个人都不可能掌握一种语言的一切词、一切句式,也不可......
研究包含两项实验考察中文阅读中的词切分是否受年老化影响。发现如下结果:(1)实验一显示,静态提示词汇正确边界(词间空格和词阴影......
探讨了一种自然语言理解(NLU)切词系统的设计思路。首先,综合运用各种传统分词方法,提出所有可能的切分结果,同时建立切词领域本体知识......
该文提出了面向维吾尔语关键词检索的两种切词算法,并给出MATLAB实现的算法代码及详细说明;在同等条件下对两种算法的切词效果和关......
摘要:中文信息处理是NLP(自然语言处理)的一个组成部分,它是研究自然语言的学科,它和其他学科如计算机学,文学,理工学等有着一定的综合联......
研究包含两项实验,分别采用静态提示词汇边界的范式考察年老化是否影响阅读中的切词过程问题。结果发现:静态提示词汇正确边界的两......
针对直接从大型网络日志中提取网络事件困难的问题,提出了基于大规模网络日志的模板提取方法。该方法可将海量的、原始的网络日志......
该文提出了面向维吾尔语关键词检索的两种切词算法,并给出MATLAB实现的算法代码及详细说明;在同等条件下对两种算法的切词效果和关......