LDA主题驱动的中文多文档自动文摘方法

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户：hefner

【摘要】

：

多文档自动文摘能够帮助人们自动、快速地获取信息，本文实现了一个基于主题模型的中文多文档自动文摘系统，其中主题模型采用浅层狄利赫雷分配(LatentDirichlet Allocation，LDA)，

【作者】

：

张明慧[1]王红玲[2]周国栋;

【机构】

：

苏州大学计算机科学与技术学院,江苏苏州 215002

【出处】

：

第五届全国青年计算语言学研讨会(YWCL 2010)

【发表日期】

：

2010年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多文档自动文摘能够帮助人们自动、快速地获取信息，本文实现了一个基于主题模型的中文多文档自动文摘系统，其中主题模型采用浅层狄利赫雷分配(LatentDirichlet Allocation，LDA)，该模型是—个多层的产生式概率模型，能够检测文档中的主题分布。该方法使用LDA为多文档集合建模，通过计算句子在不同主题上的概率分布之间的相似度作为句子的重要度，并根据句子重要度进行文摘句的抽取。实验结果表明，该方法所得到的文摘，性能优于传统的文摘方法。

其他文献

Win32平台下女书拼音输入法的设计与实现

女书是中国湖南省江永县流传的世界上唯一的女性专用文字，是人类文明的一朵奇葩，目前正在申请世界非物质文化遗产。女书研究的发展对女书数字化提出了迫切需要。女书输入法

会议

基于Uniscribe和OpenType的蒙古文字处理软件MWord的设计与实现

MWord是一种集文本、表格、图形、图象处理于一身的字处理软件，它采用OpenType字库技术和Uniscribe布局引擎解决了Windows环境下蒙古文编码国际标准的实现问题。本文重点

会议

乖顺背后的坚持——访厦门航空飞行员关键

命运负责洗牌,但是玩牌的是我们自己。当年正值十七八岁的关键目光坚定地望着父母说“我要参军,当飞行员”时,所有人意外之余,也感受到这个平日乖顺的孩子体内潜伏着的那份能

期刊

厦门航空七八北方汉子战争时代爱情故事不知道矛盾统一体报名参军飞行学员飞行安全

基于声频特征的维吾尔语语音端点检测方法

针对传统基于短时能量和短时过零率的端点检测方法中存在的对清音检测性能以及抗噪声性能较差的缺点，结合维吾尔语的声频发音特征，提出了一种计算较为简单，受噪声影响较小的语音

会议

声频特征维吾尔语语音端点检测检测方法抗噪声性能检测新方法高噪声环境短时过零率噪声影响检测性能发音特征短时能量实验计算

唐诗文本自动分类的算法研究

本文旨在研究如何基于题材和感情，试对唐诗文本进行自动分类，即对现行的通用文本分类算法，做基于唐诗文本的比较实验和参数微调。本文的目的在于初步试探唐诗自动分类算法，发现算

会议

唐诗文本自动分类诗文本自动分类算法文本分类算法分类研究发现算法参数微调比较实验题材焦点基础关节感情

基于法律文本的藏语句子边界识别

由于传统藏语书写中标点符号的特殊性，在藏语句子中如何找到正确的句子边界，是正确识别句子的首要问题。本文通过对藏语法律文本语料的观察，利用规则提出了一个藏语句子边界的识

会议

法律文本藏语句子边界识别算法句式特点标点符号特殊性语料问题规则分析

书法家·黄秋实

黑龙江省文联原副主席兼《书法赏评》杂志主编。中国作家协会会员,一级作家。中国书法家协会会员,黑龙江省书法家协会顾问。著有《大自然·生活·我》、 Former chairman of

期刊

书法家协会作家协会会员黄秋实书法作品副主席中国美术馆雪斋挪亚方舟艺术研讨会文艺精品

依存信息在蛋白质关系抽取中的作用

基于核函数的蛋白质关系(PPI)抽取可以捕获结构化句法信息，取得了较高的性能，但计算复杂度过高。本文结合词汇、句法信息，重点探讨了依存信息对基于特征向量的蛋白质关系(PP

会议

句法信息蛋白质关系抽取特征向量PPI性能计算复杂度语料库实验基本短语结构化核函数系统词汇测度捕获

促进风险投资发展的财政政策选择

我国的风险投资业发端于1985年,历经了从无到有、从散乱无序到逐步规范的过程,已经有了较大程度的发展,但同时也应该看到,目前风险投资公司规模过小,实力较弱;资金投入不足,

期刊

风险投资业财政政策选择风险投资公司高新技术产业资金投入科技成果转化率税收激励政策资金来源渠道抵免风险投资基金

警惕食用鱼胆中毒

鱼胆,俗称苦胆,生于鱼腹的上部。它不但味道非常苦,而且多数含有毒性,其毒素虽有药用价值,但人们往往却忽视鱼胆的危害。据研究,鱼胆中含有胆酸、甘胆酸及胆色素和钙盐等成

期刊

鱼胆中毒甘胆酸如黄钙盐草鱼胆汁药用功能人体健康水火烫伤中毒事故阿尔法

LDA主题驱动的中文多文档自动文摘方法

与本文相关的学术论文