用于网络新闻热点识别的热点新词发现 - 开源共享论文下载平台 - 信丰网

用于网络新闻热点识别的热点新词发现

来源 :计算机应用 | 被引量 : 0次 | 上传用户：lancer523

【摘要】

：

通过分析网络新闻热点词的特点,提出了一种用于网络新闻热点识别的热点新词发现方法。首先,用改进FP-tree算法提取频繁出现的词串作为热点新词候选,删除新闻数据中非频繁1-词串,并利用1、2-非频繁词串切割新闻数据,从而删除新闻数据中的大量无用信息,大幅降低FP-tree复杂度;其次,根据二元逐点互信息(PMI)扩展成多元PMI,并引入热点词的时间特征形成时间逐点互信息(TPMI),用TPMI判定热

【作者】

：

王煜徐建民

【机构】

：

河北大学网络空间安全与计算机学院

【出处】

：

计算机应用

【发表日期】

：

2020年12期

【关键词】

：

热点新词 FP-TREE 逐点互信息(PMI) 邻接熵时间特征 hot new wordFrequent Pattern tree(FP-tree)Point

【基金项目】

：

国家社会科学基金资助项目(17FTQ002),河北省社会科学基金资助项目(HB15SH064)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过分析网络新闻热点词的特点,提出了一种用于网络新闻热点识别的热点新词发现方法。首先,用改进FP-tree算法提取频繁出现的词串作为热点新词候选,删除新闻数据中非频繁1-词串,并利用1、2-非频繁词串切割新闻数据,从而删除新闻数据中的大量无用信息,大幅降低FP-tree复杂度;其次,根据二元逐点互信息(PMI)扩展成多元PMI,并引入热点词的时间特征形成时间逐点互信息(TPMI),用TPMI判定热点新词候选的内部结合度和时间性,剔除不合格的候选词;最后,采用邻接熵确定候选新词边界,从而筛选出热点新词

其他文献

基于云教学平台的高校创新与创业教育课程的实践探索

在我国经济加速发展、全国市场经济主体释放出更大空间的时期,为响应国家号召,充分推进“大众创业、万众创新”,新时期大学生也成为推动市场经济发展的主要群体。对大学生进

期刊

云教学高校创新创业教育课程改革

颅内原发淋巴瘤研究新进展

原发中枢神经系统淋巴瘤是一种较罕见的中枢神经系统恶性肿瘤,不向中枢神经系统轴以外播散,生物学行为具有侵袭性,病理形态存在异质性,临床无典型性,影像表现多样性,实验室检

期刊

原发中枢神经系统淋巴瘤诊断治疗Primary central nervous system lymphoma Diagnosis Therapy

新型压敏胶研究

研究了以丙烯酸、丙烯酸乙酯等为单体，以过硫酸铵为引发剂，合成水溶性压敏胶的过程，讨论了单体浓度、引发剂用量、反应温度、反应时间以及pH值与保存时间之间的关系。通过对比实

期刊

水溶性压敏胶丙烯酸合成过硫酸铵引发剂pressuresensitive adhesionacrylic acidsynthesis

企业文书档案的立卷改革与发展

本文主要论述文书档案立卷工作。（1）文书档案立卷发展的过程。（2）如何加强文书档案立卷改革工作。（3）开展电子文件信息采集的要求。

期刊

档案工作立卷改革信息采集

浅析中西言语交际差异

期刊

骨髓间充质干细胞移植治疗缺血性心脏病的研究进展

缺血性心脏病的常规治疗虽然可以改善冠状动脉供血、挽救缺血心肌,但无法使已坏死的心肌再生,所以应用干细胞替代受损及死亡的心肌细胞改善心功能逐渐成为近年来国内外研究的

期刊

骨髓间充质干细胞缺血性心脏病移植治疗心肌再生Bone marrow mesenchymal stem cell Ischemic heart disea

核心交换机断电之后……

近日一个下午，我单位安装电源插座时，电工不小心碰到另两个开关，—个开关断开，另—开关瞬间接触不良导致所连接的设备发生重启。因瞬间接触不良开关所连设备是我单位核心光纤交换

期刊

核心交换机断电接触不良应用系统光纤交换机电源插座服务中断开关

前锯肌平面阻滞在乳腺癌患者围术期镇痛的应用

目的探讨超声引导前锯肌平面(SP)阻滞在乳腺癌患者围术期镇痛的应用。方法选择乳腺癌根治术患者50例,随机分成SPB组和C组,每组25例。SPB组在清醒状态行超声引导术侧前锯肌平

期刊

超声引导前锯肌平面阻滞乳腺癌手术围术期镇痛

基于“产出导向法”的医学院大学英语口语翻转课堂实证研究

“产出导向法”是一套适合我国国情的本土化外语教学理论和方法。本文基于此方法,进行了为期八周的实证研究。本文首先对国内相关研究状况进行了分析,然后具体呈现了教学实践

期刊

“产出导向法”大学英语英语口语翻转课堂

开展综合实践活动,培养学生数学核心素养

发展学生的数学核心素养已经成为当今国内外数学教育研究的一个重点和热点。社会各界对教育的要求也越来越高,且不满足于只关注分数的教育方式。学生的核心素养以及适应社会

期刊

综合实践活动数学核心素养“现实”“数学化”“再创造”

与本文相关的学术论文