基于聚类的文本机会发现关键问题研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户：woailzm002

【摘要】

：

现实世界中的一个事件序列可能包括原因、结果和一些值得注意的事件。通常,最根本的原因是隐藏的,或在重要事件中是未知的。传统的信息处理方法通常是通过对频繁出现事件的分

【作者】

：

孙晓华

【出处】

：

哈尔滨工程大学

【发表日期】

：

2010年期

【关键词】

：

文本机会发现 KeyGraph 聚类免疫 Agent

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现实世界中的一个事件序列可能包括原因、结果和一些值得注意的事件。通常,最根本的原因是隐藏的,或在重要事件中是未知的。传统的信息处理方法通常是通过对频繁出现事件的分析实现未来可能性的预测。但是,在这些信息中除频繁事件之外,还包含着一些极少出现而又具有重要作用的事件,这些事件对未来同样具有重要的影响作用,而传统方法却无法发现这些重要事件。机会发现为实现获取观测结果中稀少的、重要事件提供了切实可行的理论和方法。文本是目前一种重要的信息承载方式。本文以文档数据为研究对象,基于聚类技术对文本机会发现的若干关键问题进行研究。本文通过对机会发现现有理论和技术方法的研究,首先提出了文本机会的定义,并进一步建立了基于聚类的文本机会发现过程模型。明确了文本机会发现过程是一个在人的经验指导下的计算机自动进行聚类的人机交互的双螺旋过程。其次,分析了现有的经典机会发现算法KeyGraph的优缺点,针对KeyGraph算法计算复杂的缺点,提出了一种多遍扫描KeyGraph执行模型,提出利用矩阵分解实现KeyGraph的具体计算,对KeyGraph的计算方法改进。有效地提高了算法的执行效率,减少计算数据量,并降低了时间空间复杂度。第三,文本数量的急剧增加使得现有机会发现算法难以快速、有效地实现机会的提取。为解决此问题,本文在现有研究基础上,通过对目前典型机会发现算法的预处理过程以及算法自身的细致分析,首先提出了既能降低算法复杂性,又能够保留数据语义信息的文本机会发现预处理算法,实现了事件的一致化描述;其次,提出基于进化免疫网络的文本机会发现算法,利用进化免疫网络压缩数据规模的优点,解决了大规模文本数据机会发现所带来的问题。该提取算法与预处理算法增加了机会事件提取的准确性和有效性,有效地提高了算法的执行效率,降低了系统的存储开销。最后,提出了一个基于免疫的多agent文本机会发现系统框架,并基于动态免疫网络建立了系统的响应模型。本文以科技文献应用为背景,发现样本数据集中的文本机会,使读者能够快速理解文章结构,从而验证了文本机会发现技术的优势。

其他文献

浅谈中职校园安全管理

近年来，中职学校数量急速增长，招生的规模日益扩大，伴随而来的是管理难度的增大，尤其是校园的安全管理，成为了摆在各中职学校面前的一个重要课题。

期刊

安全管理解决办法

应用光学实验开放式教学模式的探索和研究

在高等教育改革过程中，逐渐重视了实验教学对应用型本科人才培养的影响，因此需要加强实验教学的研究与实践，有效地提高教学质量。应用光学实验作为光电类专业学生的基础实验课程

期刊

应用光学实验教学开放式教学改革applied opticsexperimental teachingopen styleteaching reform

四辊式热定径机工艺实践

介绍了四辊式热定径机的由来及主要工艺参数，叙述了其结构、轧辊长度设计、轧辊传动方式、轧辊间隙消除方式等的技术特点和孔型设计要点，简要分析了3种定径机（二辊式、三辊式和

期刊

无缝钢管热定径机四辊式孔型设计外径精度

互联网+背景下大学生微商创业研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

互联网+大学生微商创业

宁夏引黄灌区渠道沿革初考

期刊

宁夏平原银川平原灌溉渠道唐来渠卫宁平原宁夏引黄灌区河西灌区灵武县农田水利建设回乐县七级渠青铜峡

关于电力工程建设项目管理的应用分析

电力工程建设过程中一旦出现很大事故，都会导致非常严重的后果。因此，电力企业在发展过程中要承担的责任也是非常大。本文就电力工程建设项目管理的应用问题进行了具体分析。

期刊

电力工程建设项目项目管理electric power engineeringconstruction projectproject management

高速公路隧道与互通连接段的安保对策研究

互通立交出口匝道离隧道出口过近,将使驶向互通出口匝道的驾驶员从隧道驶出后不能很平顺地变换车道,造成错过出口匝道,甚至由于急切变换车道而使运行速度突变导致车辆追尾引

期刊

交通安全高速公路隧道与互通连接段速度控制多级预告车道变换

论城市房产资源的管理和开发

城市房产资源档案是城市房地产业务活动的真实记录，是城市面貌和发展的历史见证，是研究城市的发展历史、研究房地产业的发展历史及其规律的重要参考依据。因此，重视房产档案工作

期刊

城市房地产开发和利用房产资源管理部门档案管理工作资源档案发展历史业务活动

基于病例模块教学的《诊断学》形成性考核评价体系初探

（杭州师范大学医学院诊断学教研室，杭州 310015）　　摘要：目的研究形成性考核在以病例为模块的教学法中的应用效果；方法 2014级临床医学专业学生作为研究对象，一班96人使用传统教学法和期终闭卷笔试法考核，二班92人采用基于病例模块教学法和形成性考核，以期终统一考试和问卷调查进行教学效果评价。结果相同教学大纲和教学内容，传统教学法和期终闭卷笔试法考核的学生期末平均考试成绩74.6分，基于

期刊

诊断学形成性考核病例模块问卷调查diagnosticsformative assessmentcases-based modularity teachi

X90级埋弧焊管焊接工艺及焊接接头性能

本文介绍了X90级埋弧焊管焊接工艺的发展,分析了X90级埋弧焊管焊接工艺以及焊接接头性能。由于X90级埋弧焊管具有很好的焊接性能,因此其在管道运输建设中有着重要应用。我国

期刊

X90埋弧焊管焊接工艺接头性能

基于聚类的文本机会发现关键问题研究

与本文相关的学术论文