【摘 要】
:
在传统垃圾邮件过滤技术的基础上,提出一种融合LDA主题模型和Word2vector模型的文档向量,并将LDA主题模型得到的不同维度的文档——主题矩阵、Word2vector模型得到的词向量以及融合的文档向量作为支持向量机和逻辑回归的特征输入,通过8组对照实验的效果分析得到:融合的文档向量结合支持向量机模型的准确率最高,能够对垃圾邮件进行精准过滤,降低了垃圾邮件对个人以及社会的危害。
【机 构】
:
浙江鹏信信息科技股份有限公司,中国移动通信集团浙江有限公司,
论文部分内容阅读
在传统垃圾邮件过滤技术的基础上,提出一种融合LDA主题模型和Word2vector模型的文档向量,并将LDA主题模型得到的不同维度的文档——主题矩阵、Word2vector模型得到的词向量以及融合的文档向量作为支持向量机和逻辑回归的特征输入,通过8组对照实验的效果分析得到:融合的文档向量结合支持向量机模型的准确率最高,能够对垃圾邮件进行精准过滤,降低了垃圾邮件对个人以及社会的危害。
其他文献
我国农村基层民主建设是中国特色社会主义政治建设的重要内容。推进农村基层民主政治建设,既是关系我国农村改革和发展的重大现实问题,也是建设有中国特色社会主义民主的关键所
【摘 要】“电视编导”是一个电视业界、学界和电视观众耳熟能详的概念,但却一直没有清晰的界定。长期以来,在高等教育本科专业目录中作为艺术类的“广播电视编导专业”,与电视节目传播业务中实际存在的“编导”工作岗位之间缺乏一致性,不能很好地相互契合,学界与业界严重脱节,这也是高等教育不适应社会发展需求的一个典型表现。从传播学的媒介理论视角辨析“广播电视编导”与“影视编导”、“导演”、“导播”、“编剧”、“
电子政务的概念来源于美国,其涵义是指政府机构在管理和服务的过程中运用现代信息技术,通过互联网实现组织结构和工作流程的优化重组,超越时间和空间以及部门之间的分隔制约,向社会提供全方位的信息共享和服务。 一、中国电子政务发展的历程和现状 中国政府信息化和电子政务发展的历程:中国电子政务的发展是从办公自动化开始的。20世纪80年代,我国政府机关开展了办公自动化(OA)工程,建立了各种内部信息办公网络
二进制代码同源性分析在代码的专利保护和恶意代码溯源分析中有重大意义,本文提出了一种基于基本块指纹的、以更细粒度的对比分析算法来确定二进制代码同源性的方法。该方法从基本块中提取三个指纹信息:跳转逻辑特征、代码序列特征和子函数名特征,将基本块的控制流程图根据跳转逻辑表示成由0、1构成的序列以计算基本块跳转逻辑特征的相似度,利用基于滑动窗口的点距阵方法计算代码序列特征的相似度,并用Levenshtein
提出一种研制具有参数自整定、自适应控制、在线监测、运行状态预测、智能保护等功能的变频调速装置的思路,该变频调速装置以DSP为核心控制部件,采用专家系统、人工神经网络
航空自组网允许节点通过两种方式直接通信,即单跳式和多跳式,其不需要依赖于地面控制中心,即可为航空通信提供灵活网络架构。以此为基础,改设计能够自行组织多址接入协议——TDMA。在拓扑透明时和时隙自组织的基础上,通过引入时隙二次分配形式,能够保障网络时针保持空闲与冲突时隙。通过数字模块分析二次节点竞争中的最佳概率,能够使保障时隙的最佳利用率。
在网络信息技术不断发展的过程中,计算机也被广泛应用到人们生活、工作与学习中。在应用计算机的过程中,人们对计算机也越来越依赖,其满足了人们的基本日常需求,计算机也使现社会成为了一个不出门就可以了解外界发生的事情的社会。但是,计算机网络信息在发展过程中还面临着安全威胁问题,网络安全影响着信息的完整性及安全性。目前,人们对网络安全尤为重视,网络安全教学的主要内容就是网络安全协议设计。
目的 研究4个遗传性凝血因子Ⅶ(FⅦ)缺陷症家系的临床表型及基因突变.方法 用一期法测定先证者及其家系成员的凝血酶原时间(PT)及FⅦ活性(FⅦ:C),用双抗夹心ELISA测定血浆中F