【摘 要】
:
随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优势,使得其实用价值得到充分体现.而主题划分是自动文摘系统中文本结构分析阶段所
【机 构】
:
清华大学计算机系智能技术与系统国家重点实验室
论文部分内容阅读
随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优势,使得其实用价值得到充分体现.而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题.本文提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性.实验结果表明,该算法对多主题文章的主题划分准确率为92.2%,对单主题文章的主题划分准确率为99.1%.
其他文献
目的观察静滴加替沙星氯化钠注射液治疗非淋菌性尿道(宫颈)炎的临床疗效和安全性。方法对沙眼衣原体或/和解脲脲原体非淋菌性尿道(宫颈)炎患者133例,采用加替沙星氯化钠注射液静滴
目的观察乳果糖溶液的通便功能。方法采用双盲法将127例受试者按其便秘症状随机分为试食组和对照组,试食样品组服用受试样品,对照组不进行任何处理。连续服用7d后,观察两组排便
早期梅毒由于其皮疹的多样、复杂、无特异性,临床易误诊。我中心性病门诊于2000年8月~2007年8月共收治了39例早期梅毒误诊患者,现报告如下。
介绍如何利用ADO.NET技术操作数据库,利用画布对象(Graphics)的画线方法(Draw Line)和输出数据方法(Draw String),在指定位置按照指定线粗、指定长度打印线段,在指定位置按照指定字
本文提出一种自举的二元关系和二元关系模式获取方法BRPAM,并根据该法设计了一个能够从自由文本中进行二元关系抽取的IE系统BRPAM2Texts.将BRPAM2Texts用于从自由文本中抽取
目的了解平顶山市患者泌尿生殖道解脲支原体(uu)和人型支原体(Mh)的感染情况及其在体外对抗菌药物的耐药趋势。方法采用“支原体分离鉴定计数药敏”试剂盒对临床标本作支原体培养