二元语法相关硕士博士期刊学术论文

二元语法相关论文

利用汉字二元语法关系解决汉语自动分词中的交集型歧义

本文提出了一种利用句内相邻字之间的互信息及ｔ－测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法．汉字二元语法关系（ｂｉｇｒａｍ）为......

期刊

汉语自动分词二元语法汉字集统计量分词系统训练样本匹配法中文信息处理字串分析算法

汉语连续语音识别中关键词可信度的贝叶斯估计

在一个基于经典隐马尔可夫模型（Hidden Markov Model,HMM）的汉语全音节、非特定人、连续语音识别系统中,利用声学层分数和基于拼音的......

期刊

连续语音识别贝叶斯估计隐马尔可夫模型语言模型二元语法测度函数说话人语义模型后验概率鉴别能力

中文校对系统中的修改建议提供算法

该文介绍了对中文校对系统所侦测出来的错误字串提供修改建议的算法。这个算法已应用在ＩＢＭ中国研究中心研究的中文校对系统ＣＥＣ中。它首先......

会议

中文校对系统修改建议算法字处理软件Ｌｏｔｕｓ侦测研究中心统计模型输入编码二元语法字音字义字形中国整理应用评价集成词典

视频特征及其描述词汇的对齐研究

基于视频的动词语义习得模型,简称ViMac-V系统,是一种自然语言生成系统。ViMac-V首先在学习阶段从双通道语料中习得动词框架和各成......

学位

词共现最小编辑距离词性相似度二元语法

多特征融合的Voting-SRM情感分类研究

情感分类是自然语言处理领域的一个核心问题,其目的是判断评论文本的情感极性,并挖掘其蕴含的情感价值信息.为了提取评论文本中潜......

期刊

词性标注二元语法随机梯度下降投票机制情感分类

哈萨克语词性自动标注研究初探

词性标注在很多信息处理环节中都扮演着关键角色。哈萨克语作为新疆地区通用的少数民族语言之一，自然语言处理中的一些基础性的课题......

期刊

哈萨克语词性标注构形语素二元语法 HMM Kazak Part-of-Speech tagging configuration of morpheme

基于二元语法的N-最大概率中文粗分模型

中文粗分是中文分词的基础环节,目前常用的粗分模型有基于规则的非统计模型和基于一元语法(uni-gram)的统计模型,其中后者取得了较......

期刊

二元语法 N-最大概率中文粗分模型 bi-gram N-most-probably method Chinese words rough segmentat

基于词图的最大概率分词方法

中文分词的方法主要可分为基于规则和基于统计两大类：前者一般借助于词图的方法，将分词问题转化为最优路径问题，通常切分结果不惟一；后......

期刊

中文分词词图二元语法最大概率最优路径 chinese word segmentation word graph bigram maximum pr

二元语法中文分词数据平滑算法性能研究

将多种平滑算法应用于基于二元语法的中文分词，在1998年1月人民日报语料库的基础上，讨论了困惑度和实际分词性能之间的关系，对比分析......

期刊

数据平滑中文分词二元语法 smoothing Chinese word segmentation bigram

基于N元语法的汉语自动分词系统研究

提出一种基于N元语法的汉语自动分词系统,将分词与标注结合起来,用词性标注来参与评价分词结果.首先基于词典和一元语法统计模型生......

期刊

一元语法二元语法中文分词词性标注

关于处理大规模真实文本的谈话

不同的应用领域会对自然语言处理系统提出各种不同的要求,但有一点是相同的,即希望系统处理的是自然语言,是大规模的真实文本。国......

期刊

句法分析器标注系统鲁棒性二元语法机器词典机器翻译系统

用于信息检索的古文统计分析

根据中文古籍信息检索技术的需求 ,本文在大规模语料库上对古汉语进行了统计分析。首先给出了在信息处理中多个专用语料库的动态知......

期刊

信息检索古籍检索字频统计二元语法中文信息处理

中文词语倾向性分析处理

意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判......

期刊

意见挖掘词语倾向二元语法

基于概率统计技术和规则方法的新词发现

新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究。该文分析了已有短语抽取技术,并结合汉语特点,提出了......

期刊

新词发现短语抽取二元语法语料库

一种基于新词发现的Web文本表示方法

Web文本表示是Web文本特征提取和分类的前提,最常用的文本表示是向量空间模型(VSM),其中向量一般是基于词的特征项。由于向量空间......

期刊

中文分词二元语法互信息新词发现 Web文本表示

基于最短路径的二元语法中文词语粗分模型的研究

词语粗分是分词后续处理的基础和前提，直接影响到分词系统最终的准确率和召回率。针对目前常用分词方法单一使用时存在的不足．综合机......

期刊

中文分词最短路径二元语法词语粗分模型

基于主题模型的无监督情感分类研究

随着互联网技术的迅速普及与发展，越来越多的用户喜欢在网上发表评论，分享自己对某个产品或事件的观点与看法，这使得网上含有主观情感......

学位

情感分类主题模型多粒度二元语法吉布斯采样

基于LDA的弱监督文本分类方法

针对传统的文本分类方法需要大量人工标注好的训练数据,且数据标注的好坏会影响结果等问题,通过对LDA及其相关模型的研究,提出一种......

期刊

文本分类潜在狄利克雷分布主题词序二元语法

微博短文本分类算法的研究与实现

信息技术和互联网技术在近几年的迅速发展,带动了网络社交平台的火热流行。新浪微博平台就是其中的佼佼者。随着微博用户群体的扩......

学位

短文本分类二元语法特征扩展噪声消除

看过本文同时还关注