未登录词识别相关硕士博士期刊学术论文

未登录词识别相关论文

基于深度学习的中文命名实体识别研究

随着近年来网络技术的高速发展，互联网逐渐成为越来越多信息的载体，网络平台每天产生海量的数据，如何高效地处理利用这些文本数据是目......

学位

深度学习中文注意力机制命名实体识别模型上下文信息问题位置训练未登录词识别特征融合数据集

汉语自动分词中若干关键技术的研究

该文设计并实现了一个汉语自动分词系统,对系统中采用的关键技术进行具体介绍.词典查找是影响系统切分速度的重要因素.该文提出一......

学位

中文信息处理汉语自动分词最大匹配词典组织机制歧义字段切分未登录词识别信息集成

基于用户查询的中文未登录词识别技术的研究

随着Internet的快速发展，Web信息的迅速增加，人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消......

学位

汉语分词未登录词姓名识别查询日志用户查询逻辑运算符未登录词识别

基于Hadoop的科技项目相似度计算研究

《国家中长期科学和技术发展规划纲要(2006-2020年)》实施以来,我国财政科技投入快速增长,科技项目和资金管理不断改进,为科技事业......

学位

科技项目相似度计算图模型最大团 Hadoop

面向企业信息检索的中文分词系统的研究与实现

随着企业信息的飞速增长,企业信息检索逐渐成为信息检索领域研究的热点,中文分词作为信息检索的文本处理阶段一个重要步骤,直接影......

学位

企业信息检索中文分词歧义处理未登录词识别

移动终端本地资源搜索引擎的研究与设计

随着传统互联网和移动通信网络的快速发展,网络侧及对应的终端侧数据的种类和数量也得到了快速的发展,如何快速的获取用户所需要的......

学位

移动终端本地资源搜索 Lucene 分词未登录词

基于统计学习的中文分词改进及其在面向应用分词中的应用

在汉语中,句子由连续的汉字组成,中文分词完成句子从有字的序列转化为词的序列的任务。传统的机械分词方法基于人工维护的辞典,需......

学位

中文分词互信息对数似然比三元语法未登录词识别面向应用

基于未登录词识别的汉盲翻译系统研究

随着互联网信息的发展,盲人应摆脱传统盲文书籍的束缚,享受丰富多彩的信息世界。然而,目前汉字盲文的信息化处理程度较低,盲人能够......

学位

汉盲翻译汉语盲文分词连写未登录词识别盲文ASCII码

面向中文陌生文本的人机交互式分词研究

自动分词是中文信息处理的基础课题之一。现有的分词软件和技术主要是针对现代汉语新闻科技等较为规范的文本，对于其他领域汉语文本......

学位

人机交互自动分词未登录词识别中文信息处理

商品文本中药物名称和化学名称识别的研究

分析了商品文本中药物名称和化学物质名称分词后特征,试图以规则模型和统计模型相结合的方法进行商品文本中药物名称和化学物质名......

期刊

商品文本药物名称化学物质名称规则统计模型未登录词识别

汉语信息处理中单字的构词方式与合成词的识别和理解

本文提出了汉语信息处理中关于单字构词方式的基本问题 ,考察了目前对于这个问题的研究和应用情况。认为现有的统计性结论在未登录......

期刊

自然语言信息处理汉语构词合成词意义结构方式未登录词识别

一种基于合并策略的机构名称切分方法

在就业招聘信息搜索系统中，如何正确切分机构名是一个非常重要的问题。在对机构名的组成结构进行了深入研究的基础上，提出了机构名的......

期刊

中文分词机构名切分 1-最短路径算法未登录词识别 Chinese word segmentation organization name segmentat

汉语自动分词中中文地名识别

以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名......

期刊

中文地名识别汉语自动分词未登录词识别 Chinese place names recognition Chinese automatic segmenta

基于分解与动态规划策略的汉语未登录词识别

未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名，中国地名和外国译名进行整体识别为目标，采用分解处理策略降低了整体......

期刊

未登录词识别分解处理动态规划汉语自动分词路径搜索整体识别 unknown word resolution leveled strategy dynam

面向中文陌生文本的人机交互式分词方法

自动分词是中文信息处理的基础课题之一。为了克服传统分词方法在处理特殊领域文本时遇到的困难,本文提出了一种新的分词方法,在没......

期刊

计算机应用中文信息处理自动分词未登录词识别陌生文本人机交互 computer application Chinese information pro

网络文本主题词的提取与组织研究

网络信息的指数爆炸给人们获取与掌控信息带来了困扰，为了挖掘海量信息中的关键因子并以恰当的方式进行组织，本文设计了网络文本主题......

期刊

计算机应用中文信息处理主题词提取未登录词识别切分词拼接主题词聚类 computer application Chinese information

基于分词提取重复串的未登录词遗漏量化模型

基于重复串构造候选词集合是未登录词识别（UWI）的重要方法,目前有两种策略用于重复串提取：基于字符和基于分词。该文针对这两种策略实......

期刊

未登录词识别重复串条件随机域模型中文分词 unknown words identification repeats CRF Chinese word

藏文信息处理中自动分词方法的研究

藏文分词是藏文信息处理领域的一项不可缺少的基础性工作,也是智能化藏文信息处理的关键所在。在藏文分词的研究过程中藏文分词的......

期刊

藏文分词歧义字段切分未登录词识别

中文搜索引擎中的分词技术研究

分词模块是中文搜索引擎的一个重要组成部分，针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法，首先寻找最短路径。......

期刊

中文分词未登录词识别最短路径共首字歧义词概率窗口移动法 Chinese Segmentation unknown words recognition t

基于遗传算法的汉语未登录词识别

针对汉语分词处理中未登录词识别这一难点,提出一种应用遗传算法识别的新方法。该方法扩大了分词碎片容量,将未登录词识别问题看成......

期刊

自然语言处理未登录词识别遗传算法 Natural language processing Unknown word recognition Genetic

基于词频学习和动态词频更新的藏文自动分词系统设计

藏文自动分词问题是藏文自然语言处理的基本问题之一。针对藏文自动分词中的重点难点,例如:格助词的识别、歧义切分、未登录词识别......

期刊

藏文自动分词自然语言处理格助词动态词频更新歧义处理未登录词识别 Automatic Tibetan word segmentation Natural

基于构词模式的未登录描述词自动识别的研究

本论文基于要实现二维图像空间关系特征与描述词对齐这一目的,研究如何将描述句中的"分词碎片"自动识别为描述词,增强对齐后语料的......

期刊

对齐未登录词识别构词模式词性分词碎片

中文分词技术在搜索引擎中的应用研究

中文分词作为机器翻译、文本分类、主题词提取以及信息检索的基础环节，近年来得到了广泛的关注。搜索引擎技术的广泛应用和中文信息......

期刊

搜索引擎中文分词信息检索未登录词识别歧义消解 Search Engine Chinese Word Segmentation Information

基于汉语分词的信息抽取技术

随着信息时代的到来,如何将大量无序的信息及时准确地提取、整理、组织成便于查询检索的形式,已成为研究开发的焦点.尤其是随着互......

期刊

汉语分词信息抽取未登录词识别 Chinese automatic segmentation Extraction information Log into

基于碎片分词的未登录词识别方法

提出了一种新的基于碎片分词的未登录词识别方法。该方法首先对文本进行分词,然后对分词结果中的碎片进行全切分生成临时词典,并利......

期刊

未登录词识别碎片分词贪心算法 unknown Chinese words recognition fragments segmentation gree

TF-IDF与规则相结合的中文关键词自动抽取研究

关键词的抽取广泛应用于自然语言处理过程中.对于中文关键词抽取,分词结果及候选词的选取严重影响后期的抽取结果.针对候选词的选......

期刊

抽取未登录词识别候选词抽取 TF-IDF

开源中文分词器的比较研究

中文分词是中文信息处理的基础,随着人们对中文分词技术的不断深入研究,越来越多的中文分词器诞生了,开源为大家的学习和交流带了......

学位

分词器中文分词语料库分词速度未登录词识别

基于语境和停用词驱动的中文自动分词研究

随着国民经济信息化的不断发展以及Internet的普及应用,中文信息处理成为一种热门的研究领域。因此,对中文自动分词技术的要求也越......

学位

中文信息处理中文分词未登录词识别停用词语境

基于改进PMI和最小邻接熵结合策略的未登录词识别

中文分词是中文自然语言处理的重要任务,其目前存在的一个重大瓶颈是未登录词识别问题.该文提出一种非监督的基于改进PMI和最小邻......

期刊

中文分词未登录词识别改进PMI算法邻接熵 Chinese word segmentationout-of-vocabulary detectionimpr

中文分词算法研究综述

针对制约中文分词算法效能的歧义消除和未登录词识别两大瓶颈,归纳和总结近年来基于词典、基于统计以及基于语义理解中文分词算法......

期刊

中文分词歧义消除未登录词识别词典机制语义理解深度学习 Chinese word segmentationelimination of ambiguit

专业语料库建立及其在机器翻译中的应用

在语言信息处理的研究中，语料库（特别是双语语料库）的作用日益凸现出来。机器翻译作为语言信息处理研究的一个分支，通过采用语料库技术......

期刊

平行语料库机器翻译分词未登录词识别 Parallel corpus. Machine translation Segmentation Unregis

面向中文社交媒体语料的无监督新词识别研究

该文结合词向量技术和传统统计量,提出了一种新的无监督新词识别方法。该方法利用传统统计量获得候选新词,然后采用多种策略训练得......

期刊

未登录词识别社交媒体语料词向量无监督方法

一种基于统计和规则的未登录词识别方法

介绍一种基于统计和规则的未登录词识别方法.该方法从网上下载新闻语料构筑语料库用于未登录词识别,识别过程分碎片分词识别和词结......

期刊

未登录词识别贪心算法二元模型互信息

基于词典和全切分的中文农业网页分词算法的研究

针对农业垂直搜索中中文分词要求的特殊性,提出-5基于词典和全切分的中文分词算法。该算法首先对经过预处理的网页进行基于词典的......

期刊

中文分词未登录词识别贝叶斯全切分 Chinese word segmentationunknown word identificationBayesomn

一种与分词一体化的中文人名识别方法

提出了一种与分词一体化的人名识别方法,根据中文人名内部用字产生潜在人名,可信度较高的潜在人名与其它候选切分词共同组成分词有......

期刊

中文人名识别未登录词识别汉语自动分词最短路径 Chinese personal name recognition Unknown words recogn

中文文本中外国人名与中国人名同步识别方法

根据中国人名和外国人名的构成特点产生潜在中国人名和外国人名，然后把它们作为节点词加入到句子的分词有向图中，利用上下文信息对有......

期刊

汉语自动分词人名识别未登录词识别 Chinese word segmentation person name recognition unknown wor

网络热点信息发现研究

为了有效挖掘海量网络数据中的热点信息,设计了网络热点信息发现算法。基于多级滤噪进行切分词拼接,利用特定的噪声库与多级滤噪策......

期刊

热点信息发现未登录词识别切分词拼接 hotspot information detection unknown word identification se

汉语自动分词技术研究

汉语自动分词是中文信息处理的基本问题。从分词的基本理论出发,对近年来中文分词研究的现状进行介绍,指出了能够大幅度提高未登录......

期刊

汉语自动分词分词方法未登录词识别条件随机场

TF-IDF与规则结合的中文关键词自动抽取研究

关键词抽取工作作为自然语言处理中的一个基础课题,为信息检索、文本聚类、自动摘要生成等技术提供基本支持。可以使用户快速方便......

学位

关键词抽取未登录词识别候选词抽取 TF-IDF

一种基于微博类短文本的未登录词识别和词义发现研究

未登录词识别技术对提高文本自动分词和句法分析的准确性有很重要的意义。随着网络社交平台的不断发展,微博(WEIBO,MicroBlog)平台......

学位

未登录词识别 FP-Growth算法 Word2vec POS-Dic-Cilin 相似性度量

地址要素识别机制的地名地址分词算法

本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于......

期刊

中文分词地名地址分词未登录词识别分词词典

基于机器学习的中文分词的研究与实现

词是最小的能独立运用的语言单位,然而汉语不同于西方语言的一个显著特点是文本中词与词之间没有显式的分隔标记。中文分词是是中......

学位

中文分词机器学习未登录词识别歧义处理

相似度计算在科技项目管理系统中的研究及应用

随着我国各类科技项目申请数量的快速增长，管理部门难以通过人工形式做到科学有效的审查，导致项目重复申报立项的现象屡见不鲜。因此......

学位

未登录词识别关键词提取智能检索相似度计算

基于文本相似度的中文文本聚类的研究

文本聚类是文本挖掘和信息检索领域的重要研究课题,而中文自动分词、特征选择和相似度计算等是中文文本聚类研究的关键技术。本文......

学位

文本聚类未登录词识别特征选择文本相似度多文档文摘

中文分词技术在公安信息系统中的应用研究

为了达到在保障整体分词效率和准确率基础上充分保障公安信息分析重要词汇切分的需求,本文利用公安信息文本的特点设计开发了公安......

学位

分词公安信息系统 SAFM词典 SDOS歧义识别机制 SDOSD歧义处理策略未登录词识别

基于层叠隐马模型的汉语词法分析

提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中......

期刊

汉语词法分析分词词性标注未登录词识别层叠隐马模型 ICTCLAS

搜索引擎中文分词技术研究

中文分词不仅是各种中文信息处理技术中使用最广泛的手段,也是信息检索和搜索引擎必不可少的基础性工作。现有的中文分词方法有很......

学位

中文分词词典机制最大匹配搜索引擎未登录词识别

中文分词十年回顾

过去的十年间,尤其是2003年国际中文分词评测活动Bakeoff开展以来,中文自动分词技术有了可喜的进步。其主要表现为:(1)通过“分词......

期刊

计算机应用中文信息处理中文分词词语定义未登录词识别字标注分词方法

中文自动分词法在全文检索中的研究及应用

中文自动分词,就是利用计算机将连续文本切分为以词为单位的字符序列。全文检索是以文档的全部信息作为检索对象的一种检索方式,较......

学位

中文自动分词全文检索最大匹配算法歧义识别未登录词识别互信息

基于角色标注的中文机构名识别

中文机构名自动识别是命名实体识别的重点和难点,目前各种解决方案的实际效果还难以满足人们的实际需求。本文提出了一种基于角色......

会议

中文机构名识别未登录词识别角色标注 Viterbi算法

看过本文同时还关注