基于质子串分解的网络新词汇自动抽取

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户：iqwanifir

【摘要】

：

针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法.我们从Internet上采集网页,使用改进的互信息参数(F-MI)抽取结构简单的词汇(质词);并在其基础

【作者】

：

张勇何婷婷

【机构】

：

华中师范大学计算机科学系,武汉,430079

【出处】

：

全国第八届计算语言学联合学术会议

【发表日期】

：

2005年期

【关键词】

：

质子串分解网络新词汇术语抽取中文信息参数网络媒体识别方法结构简单监测项目构成特点复杂结构分解方法精确度方法目网页基础国家采集

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法.我们从Internet上采集网页,使用改进的互信息参数(F-MI)抽取结构简单的词汇(质词);并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的词汇(合词),提高了中文自动术语抽取中长串抽取的精确度.该方法目前已在国家网络媒体监测项目中用来抽取网络中的新词汇.

其他文献

传媒语音语料库系统的设计与开发

本文介绍了传媒语音语料库系统的设计与开发.使用的开发工具是目前在国外较为流行的语言学软件开发工具Tcl/Tk,以及与之配套的语音处理软件包Snack.本文结合传媒语音语料库标

会议

传媒语音语料库语料库系统设计软件开发工具语音处理软件实现标注工具语言学软件包配套

基于人力资源管理创新问题分析与探索

摘要: 人力资源管理就是指对人力资源进行一系列的、不同形式的管理活动。详细来看，人力资源管理指的是在生产过程中，采用科学有效地管理方法，对人力资源进行合理有效的组织和调配，从而能够使人力和物力保持一个最佳的协调关系，最大程度的发挥人力资源的优势，充分发挥人力资源的积极性和主观能动性。创新人力资源管理已经成为实现人才强国战略的关键所在,新的形势对人力资源管理提出了新的要求。本文主要就当前人力资源管理

期刊

我省人力资源能力水平在中原经济发展中的效应分析

本文通过我省人力资源数量、质量、产业分布、流入与经济发展水平关系的计量模型，分析了人力资源与其他生产要素对中原经济发展的贡献，进而认为中原经济区可持续发展必须实施科

期刊

维吾尔语文语转换系统的研究

本文讨论了维吾尔语语音合成技术及方法,阐述了维吾尔语的特征及维吾尔语文语转换系统的实现过程.作者从维吾尔语的音系、语音特征出发,研究维吾尔语的语言特点,根据与其它语

会议

文语转换拼接合成韵律特征维吾尔语语音合成技术

进一步加强汉字规范笔顺的规律性

汉字笔顺规范是语文现代化建设的一个基础项目.本文以GB13000.1大字集在信息处理实践中遇到的问题为依据,结合实例对现行笔顺规范的规律性问题从部件、笔组、字形和结构等方

会议

汉字规范笔顺规范汉字笔顺信息处理部件语文现代化字形展开分析描述体系结构基础项目计算机规律性应用学习实践建设规则方法

古维吾尔文(察合台文)文献数字化整理系统中多文种混合处理的实现

本文通过多方面的分析和提出了古维吾尔文(察合台文)文献数字化整理系统构建中,多文种混合处理实现时基于Unicode的标准代码方案和键盘布局.并在此基础上提出了古维吾尔文(察

会议

古维吾尔文察合台文文献数字化整理系统构建多文种混合处理键盘布局标准代码算法基础

汉语学习者口语语料库计算机系统设计

汉语水平考试(HSK)在十多年的积累中掌握了大量汉语学习者的口语语料,建立汉语学习者口语语料库,能够让这些语料得到充分利用.本文对于汉语学习者口语语料库的建设需求进行了

会议

汉语学习者口语语料库计算机系统汉语水平考试总体设计实施方案建设

基于混合策略的查询串相似度计算方法

计算查询串之间的相似度是进行查询串自动分类和聚类的基础.针对信息检索中用户查询串特点,提出综合考虑查询串中词语的词形、语义、语用三个层面的信息计算查询串相似度的计

会议

混合策略查询串相似度字面相似度算法信息计算分类和聚类用户查询信息检索三个层面计算方法词形语义基础词语词典

口语中的链接结构及其元认知本质

链接是口语中常见的但尚未被正式命名的一种现象.作为一种超文本的话语结构,其实质是思维非线性的组织形式:由节点和链构成,包含着配套节点和链的话语结构就叫做链接结构.其

会议

内部紧密度和边缘自由度相结合的符号串单元度计算

当今社会,新词层出不穷,自动词语提取日益变得重要.本文提出了一种基于内外部信息的词语单元度计算公式.该方法利用词串每个符号之间的内部节点的结合紧密度以及边界的左右两

基于质子串分解的网络新词汇自动抽取

与本文相关的学术论文