基于贝叶斯分类器的未知恶意可执行代码文件检测

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:linda456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现行基于特征码的病毒手扫描器发现不了未知的恶意可执行代码。本文针对未知的恶意可执行文件的榆测,对训练集的恶意可执行文件与正常可执行文件提取其机器代码的统计特征,发现两者机器代码串(字节序列)之问统计特征的不同,并用有标签的文件训练朴素贝叶斯分类器,达到区分正常文件和恶意文件的目的。在训练朴素贝叶斯分类器时采用主动学习方法,用最大最小熵选择训练样本,提高了训练的效率和分类的准确性。使用标准的交叉检验法对分类器性能进行评估,表明所设计的分类器利用较少的带有标签的训练样本获得了与贝叶斯分类器使用大量训练样本相近的精度。
其他文献
土木工程为光纤智能结构技术的应用提供了许多极好的机会。本文分析了光纤智能结构技术在土木工程中的应用潜力,讨论了光纤智能土木结构研究中的技术问题,综述了光纤智能结构技术在土木工程中的应用现状,包括实验室研究与应用现状,最后展望了光纤智能结构技术在土木工程中的应用前景。
蚁群算法是一种随机搜索的优化算法,把它用于时延受限组播路由,具有良好的效果,但足算法收敛速度慢,且易陷入局部最优。为了克服这些缺点,本文提出基于克隆蚁群算法的时延受限组播路由。分析及仿真实验结果均表明,该方法具有良好的性能,且有效解决了时延受限组播路由中的全局优化问题,且收敛速度有很大提高。
面向WWW的多智能体系统的一个重要的技术挑战是如何实现异构智能体的互操作与协同,虚拟组织是电子商务研究中所提出的智能体协同模型,而以Web服务与语义Web技术为代表的Web互操作技术,则提供了实现互联网上异构智能体问互操作与协同的技术基础。本文提出了一个基于虚拟组织模型与web互操作技术的MAS平台系统,介绍了系统的体系结构及主要模块的实现,该系统目前已部分实现。
带有时延约束且费用最小的多播路由问题属于NP完全问题,针对这一问题,本文提出了免疫克隆多播路由算法(ICBMR)。与传统的遗传算法相比,本算法通过引入与具体问题相关的先验知识来指导搜索过程,加速算法的收敛速度,并且本算法操作简单,易于实现。经过仿真证明,对于一定规模的多播问题,本算法具有较快的收敛速度和较高的准确率。
随着基于网络的各种服务的迅猛的发展,入侵检测系统在分布式系统中的性能正面临着巨大的挑战。这就需要提出新的检测方法能够有效的进行入侵检测。本文提出了一种分层的基于数据融合的体系结构。在这个结构的底层,检测代理分析各种数据源,负责本地网络的检测。在第二层,融合代理对米自于各个检测代理的报警进行管理、分类、融合、关联,减少了报警数量,得出了各个报警的相关性。在高层,代理管理器进行全局的报警融合关联从而获
本文研究将现代智能优化方法中的禁忌搜索方法引入到聚类分析中米。通过对已搜索的局部最优解做出标记,可以在进一步的迭代搜索中尽量避开这些已处理过的解;通过定义某种转移概率,使搜索过程具备一定的接受次优解的能力,使搜索过程有机会跳出局部极小并消除预成熟现象。从在线手写体文字识别系统数据驱动设计中的应用试验可以看出,本文中提出的基于禁忌搜索的聚类算法具有很高的性能和很好的通用性。
将SOM作为海量数据挖掘中的通用数据压缩算法,实现了对数据的有效压缩,使经典数据挖掘算法能够应用于海量数据挖掘领域。分析了这一方法的基本思想,介绍了处理过程,并与类似算法做了比较。
多示例学习被认为足与是监督学习、非监督学习以及强化学习并列的第四类机器学习框架,是当前国际机器学习界的一个研究热点,结合多种学习范式的混合学习是另一研究热点。奉文利用混合学习技术来解决多示例学习问题,提出了五种混合型多示例学习算法。在基准数据集上的实验结果表明,混合型多示例学习算法可以比非混合型算法更好地解决多示例学习问题。
人工智能处于信息技术发展的前沿,在中学信息技术教育中开设人工智能课程,对于学生信息素养的培养、解决问题的多种,姒维方式的培养都有着积极作用,我国教育部今年颁布的普通高中信息技术课程标准(实验稿)中,正式设立了《人工智能初步》选修课。本文对国内外中学开展人工智能教育的现状、中学开展人工智能教育的意义进行阐述,并介绍了我国高中人工智能课程的教学内容选择、教学策略确定的基本思路和要点。
机器学习中统计系综方法[1,2,3]已被证明是一种改善系统推广性能的好方法,然而,在学习数据中存在大量野点的情况下,传统方法的性能可能出现急剧下降的趋势。这是因为传统方法的单一样本选择性难以处理大量野点这类困难样本。本文提出了一种基于组加权的数据选择策略,从而在数据选择时,样本权值除由其自身决定外,还I刊时取决于其所在的组,故可较好地解决野点问题,提高系统的学习性能。所提出的方法基于KING标准数