【摘 要】
:
随着互联网和新闻媒体的发展,众多信息发布网站层出不穷,网站内容监管的重要性也与日俱增。由于互联网的便利性,舆论传播和发酵的速度极快,依靠人力监控很难在第一时间发现问题。现有的敏感词检测方案也多是在网站发布内容时检测其中的敏感词,但敏感词会随着时事而变化,内容发布时的检测已无法满足舆情监控的需求。因此,必须通过自动灵活的网站敏感词监测系统来对网络舆情进行监测和处理,从而保障网络安全和社会稳定。基于上
论文部分内容阅读
随着互联网和新闻媒体的发展,众多信息发布网站层出不穷,网站内容监管的重要性也与日俱增。由于互联网的便利性,舆论传播和发酵的速度极快,依靠人力监控很难在第一时间发现问题。现有的敏感词检测方案也多是在网站发布内容时检测其中的敏感词,但敏感词会随着时事而变化,内容发布时的检测已无法满足舆情监控的需求。因此,必须通过自动灵活的网站敏感词监测系统来对网络舆情进行监测和处理,从而保障网络安全和社会稳定。基于上述问题,本文设计并实现了包含定时检测、敏感度分级、邮件告警等功能的网站敏感词监测系统。为提升敏感词检测效率,提出了一种改进的基于DFA的字符串多模匹配算法(QAT,Quad Array Trie)。构建了包含网页清洗、内容检测和敏感度分级的网站敏感度检测模型,其中内容检测部分结合QAT算法,可在不回退网页内容文本的基础上一次性与整个敏感词库的敏感词进行匹配,减少了检测时间的消耗。设计了网站敏感词监测系统的总流程,分析系统架构和功能模块,详细说明了系统登录、敏感词检测、定时任务、邮件通知、网站管理、敏感页面查看、敏感词文件管理和用户管理等模块的设计理念和实现方案。通过功能和性能测试验证系统的可用性,并对QAT算法进行应用对比测试,测试结果表明,针对十万字符以上的网页文本,QAT算法的敏感词检测效率是AC算法和DAT算法的3~6倍,比WM算法提升了2个数量级,检测时的内存消耗比AC算法和DAT算法压缩了20倍以上,比WM算法压缩了2个数量级,提升了系统检测网站敏感词时的效率。最后对系统的实际应用进行举例说明。
其他文献
长久以来,关于花菁染料噻唑橙的荧光特性积累了大量研究成果。但在探索其详细机理的过程中,受限于纳秒时间分辨荧光光谱技术的分辨率,超快荧光寿命组分和它的起源尚不明确。目前,该领域的研究依旧十分活跃,研究内容也开始向飞秒的时间尺度深化。本文主要利用稳态光谱和时间分辨荧光光谱技术,分别研究了噻唑橙在水溶液、γ-环糊精溶液、DNA体系中的分子特性和超快荧光动力学,证实了光谱变化与分子构象和聚集特性的内在联系
在21世纪全球信息化背景下,地理信息素养是人才培养的重要目标之一,也是各国基础教育地理课程改革的需要。地理教材活动栏目被视作培养素养的重要载体,但尚未有研究者对活动栏目培养地理信息素养的情况开展研究。因此,从地理信息素养的视角进行活动栏目分析具有重要的研究价值。本文运用文献分析法、德尔菲法、内容分析法以及统计分析法开展研究。首先,尝试建构效度良好的地理信息素养框架。其次,选取最新上海版高中地理必修
性别平等是我国长期坚持的基本国策,也是《联合国2030年可持续发展议程》的重要目标。其中,性别角色观念代表着人们对待两性关系的行动策略,影响着个人的社会行为,是体现和反映性别平等状况的重要指标。在中国体制转型和现代化转变背景下,理清性别角色观念的变化趋势,不仅有助于认识中国的性别平等状况和发展趋势,也有助于深入理解中国的现代化进程。近年来,性别角色观念变化趋势引起学界关注,但大多集中于考察时期变化
教师职称制度的建立旨在通过衡量教师的专业实践水平促进教师的专业发展。然而,当前教师职称制度的实施在很多方面都背离了这一初衷,如过度关注外部量化指标,忽视“教”之于“学”的影响等。随着研究的深入,学者们发现教师表现性评价能够考察教师在一定情境中的真实教学能力,提供研究教之于学影响的证据。美国新墨西哥州最早将表现性评价引入教师职级制中,于2003年建立了三级教师资格认证体系(the Three-Tie
校园欺凌是学校教育中绕不开的话题,一直以来困扰着各个国家的教育工作者。在校园欺凌频发的背景下,我国对校园欺凌的治理力度不断提升。有关部门相继推行并实施了全方位的应对策略,联动司法部门、学校、家庭、社区等,合力推进平安校园建设。2021年伊始,教育部基础教育司迅速开展针对中小学生欺凌的专项治理活动,其力度和广度前所未见,足见国家治理校园欺凌的决心。现实的关注也激发了学者们对校园欺凌研究的热情。尤其是
长期以来,我国在芯片制造和测量领域明显落后于世界领先水平。晶圆薄膜应力测量系统用于测量晶圆表面镀膜质量,在芯片制造工艺流程中起到至关重要的作用。我国对晶圆薄膜应力测量系统的需求基本依赖于进口,在实际使用过程共存在两个问题:一是测量系统的设备调试和使用流程过于繁琐,影响生产效率。二是测量结果精度较低,测量重复性无法得到保证。尤为重要的是,在当今国际科技竞争局势下,该测量系统的进口也变得愈加困难,这显
亚热带森林作为我国典型的地带性植被,是全球陆地碳汇最重要的贡献区域之一。然而随着全球气候变化的持续加剧,原本降水充沛的亚热带地区频繁地发生极端干旱事件,严重影响森林生态系统的碳水循环和碳汇功能。生态系统碳汇功能对干旱的响应依赖于植物个体碳水生理过程的响应程度,其外在表现即树木生长速率的快慢。然而,由于树木生长和碳水生理过程对极端干旱的响应具有阶段性和复杂性,其具体机理尚不明确,尤其是水分和养分利用
人口老龄化成为我国发展的新常态,伴随着家庭基本养老单位日益缩小,未来政府在老年人照护体系中的责任将越来越明确,发展多样化的养老方式势在必行。掌握老年人的健康预期寿命演变轨迹,了解不同养老方式对老年人健康状态和健康预期寿命的影响也成为完善养老服务体系重要的一环。而现有研究中鲜少涉及这一方面,因此本文围绕这一问题探究,并借此为完善养老照料体系提出可行性建议。具体方法与结论如下。首先,基于2002-20
随着基础教育课程改革的不断推进,指向知识深度理解与迁移的项目式学习成为素养时代关注的焦点。新修订的高中课程标准中许多学科如语文、信息技术、地理等均提出要使用项目式学习;实践中,项目式学习也进入了越来越多的课堂。然而,传统的评价方式已无法满足项目式学习的评价需求,指向高阶思维与核心素养的表现性评价被认为是适合项目式学习的一种评价方式。如何设计项目式学习中的表现性评价是教师面临的一大挑战。本研究基于已
笑是一种基本的社会文化现象。尽管已有丰富的研究探究机构互动中的笑,对课堂上的笑的研究仍处于课堂互动研究的边缘地位。科学本身的严肃性,使得科学课堂上的笑声尤为独特,而国内目前尚无这方面的研究。本文基于社会建构主义理论,采用基于视频的互动分析法,以上海某学校六年级科学课堂长达61小时的视频录像为主要分析材料,从中选取66个笑声互动片段进行多模态会话分析,探究科学课堂笑声发生的情境、师生参与的方式以及笑