【摘 要】
:
分类问题是常见的数据分析问题之一。在大数据时代,越来越多的数据能够被观测和收集到,分类方法也被用于解决各种实际问题,但常用的分类方法具有一定的局限性。比如线性的分类方法不能解决非线性可分的问题;很多分类方法只适用于二分类问题,不能进行多分类等。本文通过研究非参特征变换相关的方法及其在多分类问题中的应用,希望能够改善这两方面的问题。非参数的方法在分类问题中已经有了很多的应用,其中Fan和Feng等(
论文部分内容阅读
分类问题是常见的数据分析问题之一。在大数据时代,越来越多的数据能够被观测和收集到,分类方法也被用于解决各种实际问题,但常用的分类方法具有一定的局限性。比如线性的分类方法不能解决非线性可分的问题;很多分类方法只适用于二分类问题,不能进行多分类等。本文通过研究非参特征变换相关的方法及其在多分类问题中的应用,希望能够改善这两方面的问题。非参数的方法在分类问题中已经有了很多的应用,其中Fan和Feng等(2016)[1]提出的 FANS(Feature Augmentation via Nonparametrics and Selection)方法在解决非线性可分的问题方面表现出了一定的优势。由于FANS及其他进行非参特征变换的方法都只采用了单个变量的核密度估计,没有考虑到变量之间的相关性,这对模型的分类效果可能有一定影响,所以本文结合半朴素贝叶斯分类器AODE(Averaged One-Dependent Estimator)方法的思想对 FANS 进行了扩充,引入二元核密度估计来刻画变量之间的相关性,并称之为AODE-FANS。此外,实际应用中经常需要进行多分类分析,而FANS和AODE-FANS方法都只能处理二分类问题,因此本文采用了 One-vs-One的方法将它们扩展至多分类问题。为说明AODE-FANS方法的效果,本文先通过数值模拟分别验证了二分类和多分类问题下该方法与FANS方法的分类效果。然后用垃圾邮件分类数据和图片分类数据做了进一步的验证,发现AODE-FANS方法确实表现出了一定的优势。最后,本文将多分类AODE-FANS方法应用于网络日志数据的分析,基于用户的访问行为特征对用户进行分类,发现该方法能够较好地区分访问用户的类别,且分类效果优于其他的网络日志数据分析方法。
其他文献
改革开放以来,我国发生过三次较为严重的产能过剩问题。随着我国经济体制的不断优化,产能过剩的成因和形式也在不断发生变化,产能过剩已成为根植在我国经济中的一大顽疾,为了解决这一问题,需要进一步深化国有企业改革。随着全面深化改革的不断深入,党的十八届三中全会强调了国有企业的混合所有制改革,明确了国有企业改革的方向。中共十九大,习近平总书记再次强调了混合所有制改革的重要性,认为其是深化国有企业改革的重要一
槟榔所创造的“围城”,从它最初自东南亚远道而来扎根海南岛上便开始了,它的兴与衰皆是围城。海岛上的槟榔在历史上曾经以药品、贡品等身份踏足大陆,因其自然属性只能种植于华南地区,是华南特有的物产。在清朝后期,湘潭对槟榔的巨大需求催生了海南岛繁荣的槟榔种植加工业,这一影响延续到现在,海南岛的槟榔被运送到湖南加工过后又销往全国,这是从岛内到岛外的挟带着资本的流动,它影响着槟榔在岛内的流动,槟榔在岛内主要以“
近年来,随着深度学习技术和硬件技术的发展,基于深度学习的图像检测算法快速发展,并在智能制造、智能安防和医疗诊断等领域得到了广泛应用。但随着技术应用的逐步深入和推广,部分复杂生产环境下的图像检测也成为了图像检测发展的阻力。而液晶面板制造行业作为国家战略扶持行业,涌现出了一批如京东方、华新光电等的知名企业。随着液晶面板产业规模的逐步提升,对于液晶面板制造领域的自动化算法研究就成为了一个相当重要的研究领
在当前的世界格局下,创新对驱动经济增长、提升国际竞争力具有重要的战略意义。党的十八大以来,我国提出了创新驱动发展战略。创新日益成为我国引领经济新常态,实现经济持续健康发展的决定性因素。而企业作为创新的主体,促进其创新能力的提升倍显重要。但由于创新活动本身具有风险高、周期长、转换成本高等特点,同时创新产出的无形性以及创新项目的保密性要求,加剧了信息不对称,融资约束和代理问题成为影响企业创新的关键因素
近年来,我国经济发展进入新常态,经济发展的重点由“量”转化为“质”;同时,我国一直在加速推进财税体制改革,为经济的高质量发展增添动力。党的十九大报告提出,要“加快建立现代财政制度,建立权责清晰、财力协调、区域均衡的中央和地方财政关系。”由此看出,财政与事权的划分是未来财政领域的工作重点,加快建立财权与事权相匹配的财政体制将会是新常态下我国经济发展的必由之路。众所周知,1994年的分税制改革对中央和
随着时代和社会的发展,我国政府财政管理制度也在不断变化和推进,“省直管县”政策便是其中重要的一项内容。改革县在地方财政管理上与省级政府直接对接,改变原有市级政府管辖县级政府的财政管理模式。从理论上看,“省直管县”模式是地方政府财政管理体制改革的大方向。从社会角度看,公共服务水平是社会各界的热点关注问题。本文从地方政府财政管理层级改革的角度出发,把关注点落实到公共服务投入和产出水平,有利于探讨社会中
国债利率期限结构蕴含着丰富的经济信息,是微观金融资产的定价基准和宏观经济走势的衡量指标。近年来,人民币汇率形成机制改革不断深入,2015年“8.11汇改”后,汇率弹性显著增强,汇率双向波动成为常态,且利率市场化改革基本完成,这使得汇率与利率的联动效应有所增强。而国债利率期限结构反映了金融市场的综合利率水平,随着银行间国债市场的开放,其受汇率波动影响的风险也将逐步上升。汇率波动主要通过影响债券的盈利
企业非效率投资是指企业实际投资水平偏离其自身最优投资水平的一种投资行为,包括投资不足和过度投资。由于融资约束和代理冲突等问题的普遍存在,我国部分企业面临着非效率投资的问题。在完美资本市场的假设下,MM理论提出企业的投资与融资之间不存在联系,然而在我国资本市场还不够成熟的现实背景下,银行贷款仍是企业获取投资资金的重要渠道,银行的行为与规则对我国企业投资行为的影响巨大。随着银行业市场化改革的深入推进,
民营企业作为我国实体经济的重要支柱,在扩大就业岗位、增加社会财富等方面功不可没,但其社会贡献度与金融支持程度不相匹配,较长时间以来面临着融资难贵以及投资难等多重挑战。为改善这一困境,国家不断出台相应政策解难纾困,拓宽金融服务边界。近年来,加快发展金融科技,利用信息数据推进产业转化升级、提升经营服务质量成为数字时代发展要求。因此本文以上市民营企业为主要研究对象来探讨金融科技对其投资效率的影响以及金融
资本市场对外开放是指境外资金自由流入境内市场和境外投资者间接或直接地参与到本国证券市场交易中,是落实我国“十四五”规划建议中提到的推进金融双向开放的重点环节。从沪港通、深港通再到近几年的股市、债市被纳入国际指数并不断提高比重,以及证监会数据显示:自2015年以来北向资金净流入呈逐年增长趋势,2021年北向资金净流入同比翻番,表明我国资本市场综合实力有所提升,在一定程度上得到了国际的认可。A股纳入M