基于高效用模式和多分配图划分的推特突发事件检测研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wxhush
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推特(Twitter)突发事件检测是从推文数据中检测出突发事件相关信息的过程,该工作广泛应用于新闻获取、舆情分析、灾难事件检测等领域中。传统的推特突发事件检测方法存在两个问题:首先,频繁项集挖掘算法简单地挖掘出所有出现频数大于支持度的项集,而忽略了不同单词具有不同权重的问题;其次,突发词可以属于多个事件,而传统的单分配聚类算法只将一个突发词分配给一个事件。本文对Twitter突发事件检测相关问题展开了研究,主要工作如下:(1)面向事件检测的时间信息抽取。时间信息是事件的重要要素之一,广泛应用于事件检测与跟踪研究中。针对传统的基于规则的识别方法召回率低且难以识别事件类中文时间表达式的缺点,提出一种规则与统计相结合的中文时间表达式识别方法。首先,将中文时间表达式分为7类,以时间基元为单位总结正则规则,以降低规则制定的复杂度;然后,利用正则规则识别中文时间表达式,自动标注训练集,同时,人工标注出基于规则的方法无法识别的事件类中文时间表达式,利用标注完的训练集训练条件随机场模型(CRF)。实验结果表明该方法显著降低了标注工作量,提高了识别的召回率,F1值达88.73%,比基于规则的识别提高了6.37%。(2)针对传统频繁项集挖掘算法和单分配聚类算法存在的问题,本文提出一种基于高效用模式(HUPM)和图划分的推特突发事件检测方法。本文首先给出推文中单词效用值的定义、计算每个单词的效用值,然后,确定最小效用阈值,利用高效用模式挖掘算法挖掘出高效用模式(项集),最后,使用多分配图划分算法对高效用项集进行聚类,利用df-idf_t对聚类结果进行排序。实验结果表明,本文提出的方法不仅取得了良好的检测效果,同时,具有较好的时间性能。
其他文献
自声音识别装置投入实用以来,迄今已经十年了。由于当时声音识别装置价格高昂,所以最初是从省力化效果显著之处开始投入使用的,其应用领域包括分类装置的控制或检查数据的输
形式化数学是一个借助定理证明器进行数学定理机械验证的研究方向。形式化工程数学是形式化数学技术在工程数学领域中的应用。在控制系统设计中的一个关键性数学工具是Laplace变换,它被广泛地应用于求解线性微分方程和分析安全关键系统,它也是包括飞行控制系统在内的许多控制算法设计和软件设计的基础工具。定理证明是利用计算机辅助人们进行数学定理证明,它克服了纯人工证明容易出错等缺点,已经广泛应用于数学定理证明、
"让人民群众有更多获得感"这一思想为高职院校教学质量提升与发展提供了指引方向。当前高职院校教学质量诊改依然存在依赖评估模式现象、教师参与教学质量诊改意识不足、校园
社会的文明与现代化给人们的生活提供了越来越舒适的条件,但也带来了一些新的烦恼。而如何处理日益增长的各类垃圾,就是其中的一个重要问题。在这方面,一些国家采用的垃圾分类制
基于辐射度模型(RGM),考虑冠层结构如垄宽、垄间距等建立玉米冠层内不同太阳高度角PAR垂直分布计算模型,结合指数递减光分布模型,考虑LAI与植被冠层内光分布的关系,运用Campb
光学参量过程是重要的非线性光学过程之一,广泛应用于各种激光的产生、频率变换和能量转换。随着拍瓦(1015W)类高峰值功率激光装置的研究和发展,光学参量过程已成为超短激光
植物和昆虫是陆地宏体生物中分异度最高的两大类群,它们之间以复杂而精巧的方式相互作用,构成了陆地生态系统最重要的组成部分。乐平世(晚二叠世)是陆生植物发展演化的重要阶段,亦是昆虫演化的重大转折时期。研究该时期植物与昆虫可为当时的生物多样性、植物与昆虫的相互关系以及陆地生态系统重建和演化等提供重要信息。云南昭通地区乐平统卡以头组产出丰富的植物化石,且植物标本保存了大量的昆虫伤害结构。通过对1712枚植
雏鸡饲养管理、综合防疫的好坏,对雏鸡育成率和整个养鸡生产都有很大的关系。因此,在养鸡生产中必须抓好雏鸡饲养管理和综合防疫工作,提高雏鸡育成率,增加养鸡经济效益。
本研究针对黄河三角洲地区存在的土壤有机质含量低、土壤含盐量高、土地质量低下等一系列问题,进行了添加腐殖酸改良粘质盐土的试验和理论分析研究。研究采用室内试验和田间试验相结合的方法,设计了不同腐殖酸添加量下土壤水分特征曲线测定试验,以明确不同腐殖酸添加量对粘质盐土水分类型、土壤水分有效性及运动性和土壤持水保水能力等土壤水分特性的影响。探究腐殖酸对滨海粘质盐土改良的机理与措施。主要研究结论如下:(1)
反硝化菌与聚磷菌对水中碳源的竞争常导致A~2O工艺除磷效果不理想、出水磷不易达标。若能以化学除磷辅助生物除磷,这一问题则迎刃而解。Phostrip工艺是一种知名的侧流化学辅