【摘 要】
:
事件检测是政府和企业掌握敏感话题、把控舆情动态的重要手段,能够使网络社会更加和谐进步。传统媒体的事件检测方法适用于规范书写的新闻报道文章,社交媒体的事件检测方法适用于稀疏性、动态性、社会性的短文本,这两种方法都需要对文本进行处理,而文本处理过程是繁琐和效率低下的。通过网络演化进行事件检测具有简洁、高效的特点,但直接建立网络演化模型只宏观地分析了网络演化,忽略了节点的演化情况,从节点的微观角度能更加
【基金项目】
:
国家自然科学基金青年科学基金项目(No.61806072);
论文部分内容阅读
事件检测是政府和企业掌握敏感话题、把控舆情动态的重要手段,能够使网络社会更加和谐进步。传统媒体的事件检测方法适用于规范书写的新闻报道文章,社交媒体的事件检测方法适用于稀疏性、动态性、社会性的短文本,这两种方法都需要对文本进行处理,而文本处理过程是繁琐和效率低下的。通过网络演化进行事件检测具有简洁、高效的特点,但直接建立网络演化模型只宏观地分析了网络演化,忽略了节点的演化情况,从节点的微观角度能更加准确的分析网络演化。本文提出了从节点演化角度利用链路预测技术对社会网络进行事件检测的有效方法。针对基于最佳链路预测指标的方法存在敏感度不高和事件检测稳定性较差的问题,提出了基于节点演化分阶段优化的事件检测方法(Event detection method based on node evolution staged optimization,NESO_ED)。由于网络演化过程中所有节点不一定遵循相同的演化机制,所以在进行网络演化分析时采用节点最佳的链路预测指标代替固定统一的链路预测指标。在选择节点最佳链路预测指标时,将网络演化阶段划分阶段,针对不同阶段的特征采用不同的优化方法,更好地量化网络演化。在VAST、Dept1和Dept2三个数据集上进行实验,分析了网络演化过程中节点最佳指标数量总体占比情况,以及各阶段节点最佳指标数量的变化情况。通过实验发现该方法有很高的敏感性,稳定性也有所提高,适用于事件发生对网络结构改变影响较小的情形。针对基于统一链路预测指标的事件检测方法稳定性差、忽略节点异常演化和难于处理复杂网络结构的情况,提出了基于节点演化网络粗粒化的事件检测方法(Event detection method based on coarse-grained node evolution network,NENC_ED)。由于节点在网络平稳时趋向于选择固定的演化机制,在网络波动时改变了演化机制,因此异常节点对网络演化具有重要意义,所以第一步便是提取网络演化过程中具有异常演化行为的节点。用户数据量的与日俱增使网络规模也日益变大,导致算法计算量大并且事件检测敏感性也不高,所以第二步是通过网络粗粒化来简化网络结构。最后在粗粒化处理的网络中引入异常演化节点进行事件检测。通过VAST、Dept1和Dept2三个数据集上进行实验,分析了网络演化过程中节点异常演化的数量变化情况,实验结果表明此方法具有很强的稳定性和较高的敏感性,适用于事件发生对网络结构改变影响较大的情形。
其他文献
近几年来,随着极大规模集成电路的飞速发展,工艺技术节点降至7 nm及以下,集成电路制造工艺越来越复杂。传统的插塞金属钨由于其沉积过程中急剧增长的电阻已不能满足现代制造工艺的需求,可使用电阻率较低(6.63μΩ·cm)的新型插塞金属钴(Co)代替。化学机械平坦化(CMP)是集成电路制造工艺的关键步骤之一,是到目前为止实现晶圆表面部分或全局平坦化最有效的手段。阻挡层CMP是多层铜布线的最后一道工序,阻
光伏电池片中的裂纹缺陷会造成电池片失效,影响电池组件的正常使用,也不利于光伏发电系统维持稳定。光伏电池片电致发光(Electroluminescence,EL)图像呈现非均匀复杂表面,随机分布的晶粒和缺陷目标之间的对比度低,缺陷形状、尺度不一等特点,给利用传统方法对裂纹缺陷的准确性和鲁棒性检测带来很大的挑战。因此本文提出了多个深度学习模型,有效地解决了复杂背景对裂纹缺陷识别的影响,最终形成了一套有
化学机械平坦化(CMP)是集成电路(IC)制造的关键工艺之一,是实现多层铜布线局部和全局平坦化的核心技术。阻挡层平坦化是铜互连CMP制程中的最后一步,决定着IC器件的良率和可靠性。钽(Ta)具有较高的电导率和抗电迁移性,并与Cu有很好的粘附性,被广泛用作铜互连的阻挡层材料。在阻挡层CMP过程中,由于Cu/Ta两种金属活性的不同,会形成电偶腐蚀,而且CMP抛光液中部分组分也会对铜表面造成腐蚀,影响器
模式匹配是计算机领域中对字符串的一种基本运算,目的是在较长的序列中找出与给定模式相同或相似的所有子串。模式匹配在诸多领域中具有广泛的应用,如搜索引擎,金融分析,数据挖掘等。与传统模式匹配相比,带有间隙约束的模式匹配更具灵活性,其允许模式中包含指定范围的通配符数量,具有重要的研究意义。在一次性条件下的模式匹配中,模式中包含间隙约束且序列中同一位置的字符最多允许被模式使用一次,这种方法在生物信息学和序
根据世界卫生组织国际癌症研究机构发布的权威报告显示,肺癌现如今已经成为世界上发病率和死亡率最高的癌症,是危害人类生命健康的头号元凶。肺结节作为肺癌早期的重要表现形式,其有可能发展为肺癌的几率约为40%,因此精准检测和分割并且对CT图像中的肺结节准确定性成为挽救肺癌患者的关键。近年来,随着人工智能、深度学习等新兴技术的兴起,越来越多基于深度学习的模型迁移到医学图像分割上来,为肺癌的早期诊断提供了新的
风电机组具有故障率高的特点。为提高风电机组运行可靠性,论文以风电集控中心的SCADA系统作为数据来源,将某公司生产的风电机组作为研究对象,采用基于数据驱动的方法进行风电机组的故障预测与识别研究,为风电场的智能化运维提供参考信息。论文详细研究工作如下:首先,论文对风电机组的故障现象进行分析,通过SCADA系统中的风机状态码筛选风电机组处于运行状态的数据。采用数据库操作对零值、空值等系统异常值及风功率
近年来,随着我国智慧校园建设的快速发展,信息技术与教育教学深度融合成为必然趋势。在课堂教学中,学生的行为状态能够反映学生的课堂参与度和教学效果,对于教学质量评估及改进教学方式具有借鉴意义。同时,随着人工智能的发展,深度学习在语音、图像识别,自然语言处理等多个领域都取得了大量成果,新的框架模型不断涌现。其中,卷积神经网络(CNN)因其结构简单、训练参数少和适应性强等特点成为众多科学领域的研究热点之一
编辑:自您担任本刊编委起,行业对您的印象都是"暖通人",请问是什么机缘您开始把研究方向由"暖通"转向了"电气"?Editor:Your major "HV&AC"has been impressive for us since you served as our editorial board member of the Journal of Building Energy Efficien
带有间隙约束的模式匹配可以用来计算模式在序列中的支持度,是序列模式挖掘的核心技术,在生物、安全监测、数据挖掘方面有着广泛应用。传统的模式匹配分为精确模式匹配和近似模式匹配,由于实际数据中存在大量的噪声干扰,近似模式匹配的优点在于具有灵活性,相对精确模式匹配可以发现更多有价值的模式。目前,带间隙近似模式匹配主要采用Hamming距离作为度量相似度,这种度量方法仅仅能够反应出两个序列串有多少个不一致的
溴被称为“海洋元素”,被广泛应用于工农业生产中,与人们的生活息息相关。我国作为产盐大国,每年制盐副产的苦卤中含有丰富的溴资源。传统的提溴方法是空气吹出发和水蒸气蒸馏法,存在收率不高、设备庞大、不利于低浓度溴资源提取等缺点,因此需要开发新的工艺来改善溴资源的利用状况。除溴资源外,苦卤中还含有更多的钠、钾、氯元素,因此对Na+,K+//Cl-,Br-四元体系从整体上进行开发利用,有助于提高我国苦卤综合