基于质子串分解的网络新词汇自动抽取

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:iqwanifir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法.我们从Internet上采集网页,使用改进的互信息参数(F-MI)抽取结构简单的词汇(质词);并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的词汇(合词),提高了中文自动术语抽取中长串抽取的精确度.该方法目前已在国家网络媒体监测项目中用来抽取网络中的新词汇.
其他文献
本文介绍了传媒语音语料库系统的设计与开发.使用的开发工具是目前在国外较为流行的语言学软件开发工具Tcl/Tk,以及与之配套的语音处理软件包Snack.本文结合传媒语音语料库标
摘要: 人力资源管理就是指对人力资源进行一系列的、不同形式的管理活动。详细来看,人力资源管理指的是在生产过程中,采用科学有效地管理方法,对人力资源进行合理有效的组织和调配,从而能够使人力和物力保持一个最佳的协调关系,最大程度的发挥人力资源的优势,充分发挥人力资源的积极性和主观能动性。创新人力资源管理已经成为实现人才强国战略的关键所在,新的形势对人力资源管理提出了新的要求。本文主要就当前人力资源管理
期刊
本文通过我省人力资源数量、质量、产业分布、流入与经济发展水平关系的计量模型,分析了人力资源与其他生产要素对中原经济发展的贡献,进而认为中原经济区可持续发展必须实施科
期刊
本文讨论了维吾尔语语音合成技术及方法,阐述了维吾尔语的特征及维吾尔语文语转换系统的实现过程.作者从维吾尔语的音系、语音特征出发,研究维吾尔语的语言特点,根据与其它语
汉字笔顺规范是语文现代化建设的一个基础项目.本文以GB13000.1大字集在信息处理实践中遇到的问题为依据,结合实例对现行笔顺规范的规律性问题从部件、笔组、字形和结构等方
本文通过多方面的分析和提出了古维吾尔文(察合台文)文献数字化整理系统构建中,多文种混合处理实现时基于Unicode的标准代码方案和键盘布局.并在此基础上提出了古维吾尔文(察
汉语水平考试(HSK)在十多年的积累中掌握了大量汉语学习者的口语语料,建立汉语学习者口语语料库,能够让这些语料得到充分利用.本文对于汉语学习者口语语料库的建设需求进行了
计算查询串之间的相似度是进行查询串自动分类和聚类的基础.针对信息检索中用户查询串特点,提出综合考虑查询串中词语的词形、语义、语用三个层面的信息计算查询串相似度的计
链接是口语中常见的但尚未被正式命名的一种现象.作为一种超文本的话语结构,其实质是思维非线性的组织形式:由节点和链构成,包含着配套节点和链的话语结构就叫做链接结构.其
会议
当今社会,新词层出不穷,自动词语提取日益变得重要.本文提出了一种基于内外部信息的词语单元度计算公式.该方法利用词串每个符号之间的内部节点的结合紧密度以及边界的左右两