一类新的快速模糊聚类分析算法

来源 :中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会 | 被引量 : 0次 | 上传用户：jiangnanshen

【摘要】

：

目前信息模板的抽取是中文信息自动抽取中的一个主要困难.本文提出将文本中每个子句都看作样本,利用模糊聚类分析将文本中的句子进行分类,从而完成文本中信息的分类,最终实现

【作者】

：

吴思李锦涛钱跃良朱珍民

【机构】

：

中国科学院计算所数字化实验室,北京,100080

【出处】

：

中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会

【发表日期】

：

2002年期

【关键词】

：

快速模糊中文信息信息模板大文本模糊聚类算法信息自动抽取模糊聚类分析模糊等价关系聚类分析算法数据的处理分类准线性复杂度样本精度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前信息模板的抽取是中文信息自动抽取中的一个主要困难.本文提出将文本中每个子句都看作样本,利用模糊聚类分析将文本中的句子进行分类,从而完成文本中信息的分类,最终实现信息模板的自动形成.通过对常用的基于模糊等价关系的聚类分析算法的分析,我们发现它们的复杂度都过大,很难实用于中文信息中大文本数据的处理.因此我们提出了一类新的快速模糊聚类算法,它具有准线性的速度和较高的聚类精度.

其他文献

C8051F320自带USB模块实现高速数据传输

介绍了一种通用测控系统的设计方案及软硬件的设计方法,系统具有通用、便携、高速、可靠等特点.系统由计算机和测控设备组成,测控设备采用了Cygnal公司的C8051F320芯片作为控

会议

瘦素基因-2548G/A多态性与抗精神病药所致肥胖相关性的Meta分析

目的系统评价瘦素基因-2548G/A多态性与抗精神病药物所致肥胖的相关性.方法计算机检索PubMed、EMbase、CNKI和WanFang Data数据库,查找所有有关-2548G/A基因多态性与抗精神

期刊

Antipsychotic drugPsychopathLeptin geneWeight gainPolymorphismMeta-analysis

基于GIS的车辆导航系统地图匹配算法

在分析影响地图匹配的误差因素的基础上,根据车辆行驶的位置、方向信息和道路网络拓扑特性提出了一种改进的地图匹配算法.算法以GPS定位点为圆心、一个适当的误差为半径,确定

会议

2012年重庆市碘缺乏病纵向监测点监测结果分析

目的掌握重庆市碘缺乏病防治效果和病情变化的趋势。方法选择重庆市4个区县,每县随机抽取1所小学,每所小学随机抽取8~10岁儿童90名,测定儿童甲状腺肿、盐碘、尿碘及智商;同时

期刊

GoiterIodine nutritionIodized saltIntelligence quotient

新型飞行管理计算机的设计

目前成熟的飞控计算机都是采用独立式的,即联合式体系结构,这导致了设备和处理器类型的增加,以及储存和维护成本的昂贵.将飞控功能嵌入到综合化计算机平台已经成为解决该问题

会议

2011年1月我国合成香料进出口情况

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

进出口情况合成香料香豆素覆盆子酮乙基香兰素紫罗兰酮橙花醇铃兰醛萜品醇肉桂醛

根管治疗术一次法与多次法治疗感染根管治愈率的Meta分析

目的系统评价根管治疗术一次法与多次法治疗感染根管的治愈率。方法计算机检索PubMed、EMbase、EBSCO、MEDLINE、The Cochrane Library(2015年第3期)、CNKI、VIP、CBM和WanFa

期刊

Root canal treatmentInfected root canalsHealing rateSystematic reviewMeta-an

基于贝叶斯网络模型的用户兴趣联合推送

用户兴趣联合推送根据其他具有相似兴趣的用户阅读过的信息主动推送信息,从而使用户能够很容易地从web浩瀚的信息海洋中发现所需的高质量内容.本文提出了基于贝叶斯网络模型

会议

贝叶斯网络模型用户兴趣模型信息语义相似度主动推送语义关系推送系统条件概率概念质量阅读预测文档术语实验海洋方法

基于SIP的软交换系统AAA问题

基于SIP的软交换系统的安全性是它实现的一个重点.本文针对它的安全性的一个侧面-AAA问题进行阐述,简介了AAA体系结构和SIP协议,详细描述了在SIP中完成AAA的几个步骤,并给出

会议

安全性软交换系统体系结构协议描述

浅析今年股市的弱势特征

我国股市经历了96年和97年上半年的大牛市,已经达到了新一轮循环周期的高点:沪综指1500点,深成指6100点。该点位的平均市盈率已超过50,进入了市盈率40以上的高风险区,理应回

期刊

市盈率大牛市循环周期跳空高开高风险区绩优股阴跌跳空低开箱顶成交量

一类新的快速模糊聚类分析算法

与本文相关的学术论文