【摘 要】
:
朴素贝叶斯分类器(Naive Bayes,NB)是一种简单而有效的分类器,特别适用于中小规模数据分类.但作为以整体分类正确率为指导的传统分类方法,它在不平衡数据分类中对少数类的分类能力较弱.针对此问题,本文采用属性加权的方法增强朴素贝叶斯对于少数类的分类能力.类依赖属性加权朴素贝叶斯(class-specific attribute weighted naive Bayes,CAWNB)是一种有效的属性加权朴素贝叶斯算法.本文通过在条件对数似然(conditional log-likelihood,CLL
【机 构】
:
华中科技大学数学与统计学院,湖北武汉430074;华盛顿大学文理学院,华盛顿西雅图98195
论文部分内容阅读
朴素贝叶斯分类器(Naive Bayes,NB)是一种简单而有效的分类器,特别适用于中小规模数据分类.但作为以整体分类正确率为指导的传统分类方法,它在不平衡数据分类中对少数类的分类能力较弱.针对此问题,本文采用属性加权的方法增强朴素贝叶斯对于少数类的分类能力.类依赖属性加权朴素贝叶斯(class-specific attribute weighted naive Bayes,CAWNB)是一种有效的属性加权朴素贝叶斯算法.本文通过在条件对数似然(conditional log-likelihood,CLL)和均方差(mean squared error,MSE)目标函数中引入平衡系数λ,提出了两个新的目标函数λ-CLL和λ-MSE,并进一步提出了通过最大化λ-CLL或最小化λ-MSE确定最优权重值的两个不平衡数据分类算法CAWNBλ-CCL和CAWNBλ-MsE.在不平衡的UCI数据集上的实验表明,这样的属性加权可以增强朴素贝叶斯对于少数类的分类能力,同时不会过分破坏其的总体分类能力.
其他文献
文章利用西藏日喀则地区1970-2020年国家基准站风速观测资料,主要采用线性拟合、M-K突变检验、核密度概率估算等方法,首先研究了年平均风速、最大风速年际演变规律以及极大风速月分布特征,其次研究风速突变年前后变化率差异性,最后对最大风速概率分布估算研究.研究表明,年平均风速、最大风速均随着时间尺度延长呈下降趋势,且每10年降低幅度分别为0.092m/s、0.236m/s,同时突变年份分别为2000年、1999年,变化速率均在突变年前后存在较大差异性;极大风速主要集中在3~5月份;最大风速概率分布呈正态分
矩阵平方根在数学的许多应用中起着重要的作用.本文研究M-矩阵平方根的计算问题,提出一种计算正则M-矩阵平方根的迭代方法.首先将这个问题转化为M-矩阵代数Riccati方程,进而提出一种有效的方法来求解这个特殊的MARE.理论分析表明,该方法在一定条件下是收敛的.数值实验表明该方法是可行的,且优于二项式迭代法.“,”Matrix square root plays an important role in many applications of mathe-matics.In this paper,we
本文针对含扰动参数ε的含源反应扩散方程,采用待定系数法,在三点模板的中心点处进行泰勒展开,对泰勒展式中的高阶导数项充分利用原微分方程进行“降阶”,然后分别从“横向”和“纵向”两个角度进行修正,得到了两类差分格式,其中横向系列差分格式(HDS)的精度分别达到二阶、四阶和六阶.数值实验与参考格式比对效果较好,且横向差分格式适用于扰动参数ε不是很小的反应扩散问题,而随着参数减小,纵向差分格式的数值精度逐渐超过横向格式,说明纵向格式更适宜于求解小参数问题.
共轭梯度法是求解大规模无约束优化问题的经典方法之一.基于搜索方向矩阵的谱条件数,给出了一个Dai-Liao(DL)共轭梯度法中参数的自适应形式,提出一种自适应DL共轭梯度算法.在适当的条件下,对于一致凸的目标函数证明了该方法具有全局收敛性.数值结果表明,提出的方法是可行的.
分类时间序列在生物医学、社会学和遗传学等领域有着广泛的应用,累积Logistic回归模型是分类时间序列建模的一类重要模型.本文基于偏似然得分过程(Partial likelihood score process)提出一种变点序贯检验方法,监测累积Logistic回归模型的结构是否发生变化.原假设下推导检验统计量的极限分布,备择假设下证明其一致性.模拟试验和实例分析说明了方法的有效性.
本文提出并分析一类基于个体年龄的等级结构种群模型,其生命参数随时间作周期性振荡.运用不动点方法证明了周期解的存在唯一性和非负有界性.推广了一些现有结果.
作为DNA合成的重要前体,细胞中4种脱氧核糖核苷三磷酸(dATP、dTTP、dGTP和dCTP)是DNA复制、重组和修复所必需的原材料,而DNA的正确合成及其完整性则是基因组稳定性的重要体现,因此dNTP库状态的稳定对维持基因组的稳定进而保证细胞的稳定至关重要.从dNTP库的质量上讲,一些异质dNTP如氧化的dNTP掺入DNA容易引发碱基替换甚至DNA断裂重排,会极大地损害基因组的稳定性.但与此同时,细胞也进化出了相应的NTP焦磷酸酶将其清除,并且细胞也会通过形成DNA损伤修复网络来校正损伤的DNA及修复
本文研究Hilbert C*-模中K-框架的不等式问题.借助K-对偶构建了闲子模中K-框架的几个新的不等式,所得结果推广和改进了Hilbert空间中框架和Hilbert C*-模中广义框架的相应结果.
本文研究一类全空间上的Kirchhoff型方程.当非线性项在无穷远处是线性有界时,利用变分方法建立方程解的多解性结果,并讨论次线性项对问题解的多重性的具体影响,改进了相关文献中的结论.
通过Manasevich-Mawhin连续定理和一些分析技巧,本文证明一类具有强弱奇性的Duffing方程周期正解的存在性.