企业管理二分类问题研究综述

来源 :中小企业管理与科技·上旬刊 | 被引量 : 0次 | 上传用户:ecfan1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:通过梳理企业管理领域的二分类问题,发现二分类支持向量机广泛应用于客户流失预测、上市公司财务困境预警和信用风险评估。并且为了提高预测精度,学者不断改进该模型:为适应具体数据特征,如数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等,相应引入模糊、加权、双隶属支持向量机以及代价敏感性学习机制等。
  关键词:二分类支持向量机(SVM) 企业管理 综述
  1 概述
  当前,企业管理领域中的客户流失预测、公司财务困境预警、信用风险评估已成为学术界和业界关注的焦点,能否科学合理的对其进行预测,关乎企业生存和发展。利用客户静态属性数据,预测客户是否流失;利用公司财务、经营情况,预测上市公司是“财务状况正常”或“财务状况异常”;利用借款人财务、非财务状况,预测其信用状况是“正常”或“违约”。虽然上述3领域研究方向差异性大,但研究使用方法相似,因此将上述3领域研究统称为经济与管理科学领域二分类问题研究,简称二分类问题研究。
  以上二分类问题研究利用判别分析,取得了相对准确的理论结果,但该方法需要很强的假设和限制条件,而这些条件在实际分析中通常得不到满足。近年来,随着人工智能学科的发展,学者引入神经网络,并取得了优于判别分析法的结果。但神经网络很可能陷入局部最优,无法得到全局最优,同时它是基于经验风险最小化原理,经常出现“过拟合”现象。1995年Vapnik提出支持向量机模型(Support Vector Machine,SVM),一种基于结构风险最小化的算法。之后学者将SVM进入上述二分类问题研究,发现其泛化能力、预测精度都高于判别分析、神经网络。
  近年来,为提高二分类问题研究中SVM预测精度,学者不断探索如何改进二分类SVM,有效降低样本数据外点或噪声点、非平衡性、重叠性及错分代价差异性的影响。
  本文结构安排如下:第一部分是引言,第二部分是考虑样本特征的改进支持向量机,第三部分是结论与展望。
  2 改进支持向量机
  随着人工智能领域的快速发展,学者将传统支持向量机(C-SVM)引入二分类问题研究:Min和Lee将C-SVM引入上市公司财务困境预测,夏国恩等将C-SVM引入客户流失预测,发现C-SVM优于传统判别分析、神经网络。但此阶段仅限于对模型的简单应用,未充分考虑样本数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等。
  2.1 外点或噪声点
  当数据集中存在外点或噪声点时,容易使二分类SVM结果不理想,为此Liu和Huang将模糊化思想引入SVM,提出了模糊支持向量机(FSVM),根据数据点对所在类(正类、负类)的相对重要程度,分配不同的权重,以降低外点和噪声点影响。杨海军、太雷将模糊支持向量机(FSVM)算法引入上市公司财务困境预测,对沪深两市按行业板块分类的上市公司实证分析,显示该模型预测优于C-SVM。
  2.2 重叠性
  传统SVM将样本集绝对分为互斥的两类,但现实世界中这种分类不存在经济意义,即样本很可能存在重叠性,例如财务困境预测时,财务指标既定的企业,可能由于经营远离财务困境,也可能由于经营不力而陷入财务困境。
  考虑样本数据重叠性、外点或噪声点,Wang等构建了双隶属模糊支持向量机(B-FSVM),使每个样本点依据隶属函数同时属于两类,并利用3个公开信用数据库实证分析,发现B-FSVM判别能力高于C-SVM和FSVM。阚宝奎、刘志新等[1]将B-FSVM引入上市公司虚拟财务报告识别,其中样本点对于两类样本的隶属程度确定采用谱聚类方法。研究发现,该模型的判别准确率、泛化能力都显著优于C-SVM、BP神经网络,且可以显著降低将虚假财务报告识别为真实财务报告的错误。
  张目、周宗放[2]采用多目标规划,减少两类样本企业信用状况的重叠。基于TOPSIS法,分别以“正常企业”样本逼近理想点、“违约企业”样本逼近负理想点为目标,构建多目标规划模型;运用实码加速遗传算法求解得出指标综合权重,通过构造加权样本,减少两类样本企业信用状况的重叠,进而提高SVM预测精度。选取沪、深股市中具有“高新技术概念”上市公司作为实验样本,实证分析得出,该方法一定程度上利于两类样本的正确区分,使SVM的预测精度提高。
  2.3 非平衡性
  经济与管理科学中的二分类问题数据大多存在非平衡性,而非平衡性会对C-SVM分类效果产生不利影响,即C-SVM只会对数量上占优的类别具有很强的识别能力[3]。解决数据非平衡性可使用向下采样方法或构建相应模型。向下采样方法:以客户流失预测为例,从非流失客户中抽取部分样本与流失客户样本构成k:1的训练集。这种方法虽然平衡了训练集类分布,但损失了很多信息,且抽取比例、k取值确定需要多次尝试和实验。
  应维云、覃正等[4]考虑到流失客户和非流失客户正负样本数据不平衡,引入分类加权支持向量机算法(CW-SVM),对深圳市某银行个人信贷部的客户信贷数据分析,结果表明CW-SVM要好于神经元网络和决策树方法。其中CW-SVM算法,能够通过调整类权重参数,改变分类面位置,进而提高算法分类准确性。
  2.4 错分代价差异性
  二分类问题研究,很难使用传统的基于预测准确率的模型解决,如客户流失、信用评估等,这些问题中不同类别样本的错分代价相差很大。解决错分代价差异问题,可以通过样本数据的预处理,也可以通过引入错分代价差异:阚宝奎、刘志新等考虑到人们对于两种判别错误的“厌恶程度差异”,在双隶属SVM建立时,对训练样本进行“非对称”处理(将虚假财务报告视为绝对属于虚假财务报告,而所谓的真实报告“谨慎”对待,进行双隶属分析)。这种新方法在公司财务报告真伪判别时,表现出了高于C-SVM和BP神经网络的判别准确率、泛化能力,并且显著降低了将虚假财务报告识别为真实财务报告的错误。钱苏丽、何建敏等[5]将错分代价纳入分类算法,同时考虑数据不平衡问题,建立了代价敏感支持向量机,使算法基于代价而非基于准确率。利用中国电信某分公司预付费小灵通用户数据实证,显示改进SVM能显著提高模型效能,且模型能够在两类错误(将流失客户错误预测为不流失客户、将不流失客户预测为流失客户)中找到一个平衡点使代价最小,弥补了传统模型默认代价相同、一味追求准确率的不足。
  3 结论与展望
  当前,对客户流失预测、财务困境预警、信用风险评估的研究方兴未艾,继传统统计模型、神经网络等,学者引入支持向量机。总体看来,二分类支持向量机预测精度、泛化能力都高于其他模型,同时为了进一步提高其效果,学者不断研究:针对数据特征(存在外点或噪声点、非平衡性、重叠性、错分代价差异性等)相应引入模糊支持向量机、加权支持向量机、双隶属支持向量机以及代价敏感性学习机制等。虽然有关二分类支持向量机的研究趋于成熟,但仍存在一定的局限性:目前仍没有很好的方法指导针对具体问题的核函数选择,缺乏有效方式将二分类问题扩展为多分类问题研究,将是未来研究方向。
  参考文献:
  [1]阚宝奎,刘志新,宋晓东,杨众.改进支持向量机在虚假财务报告识别中的应用[J].管理评论,vol.24,2012(5).
  [2]张目,周宗放.基于多目标规划和支持向量机的企业信用评估模型[J].中国软科学,vol.4,2009(5).
  [3]Gang Wu,Edward Y.Chang.Class-Boundary Alignment for Imbalanced Dataset Learning[C].ICML Workshop on Learning from Imbalanced Data Sets II,Washington DC.2003.
  [4]应维云,覃正,赵宇,李兵,李秀.SVM方法及其在客户流失预测中的应用研究[J].系统工程理论与实践,Vol.7,2007(7).
  [5]钱苏丽,何建敏,王纯麟.基于改进支持向量机的电信客户流失预测模型[J].管理科学,vol.20,2007(2).
  作者简介:牛轩(1989-),女,河北新乐人,硕士研究生,研究方向:市场调查。
其他文献
摘要:以竞争力优势理论——“钻石模型”理论为依据,对济南会展行业的发展情况以及竞争力影响因素进行具体分析。考察竞争优势的来源,发现存在的问题,提出优化和改进的对策建议。  关键词:济南 会展业 竞争力 钻石模型 调查研究  伴随着我国会展经济强劲的发展态势,会展产业的带动效应日益明显。济南会展业历经十余年的发展,规模、质量和影响力迅速提升。2012年济南市被评为“中国十大影响力会展业城市”,跃居国
期刊
摘要:近年来,美国电视剧已经悄无声息地来到我们身边,并以强大的渗透力迅速在青年群体中流行起来。从《越狱》到《绯闻女孩》,从《吸血鬼日记》到《生活大爆炸》……伴随着这些美剧流行,以美剧为传播媒介的美国文化在与中国本土文化的融合中展现了强大的生命力,越来越影响新一代中国青少年的世界观的形成。本文以《生活大爆炸》这部情景喜剧为例,通过对美剧特点的分析,具体探究美国情景剧在中国的跨文化传播对中国情景喜剧市
期刊
摘要:本文通过对陕西省老年人口健康现状的分析,以及对陕西省社区卫生服务机构情况的介绍,说明老年人对社区卫生服务的需求在逐年增长,而社区卫生服务的供给却十分有限。政府应增加对社区卫生服务的投入,为解决人口老龄化带来的社会问题早作准备,落实老龄工作目标。  关键词:老龄化 健康状况 社区卫生服务  1 概述  我国人口老龄化增长速度快,老年人口数量多,预计在未来25年中我国老年人口的比例将达到14%[
期刊
摘要:本文以中国2008年底前深市中国医药制造企业44家为样本,选取了能较全面反映企业生命周期的5个财务指标为变量计算综合增长指数,划分企业生命周期;在此基础上选取了财务指标和非财务指标,运用熵权法对企业构建综合得分模型,分别对各生命周期的企业进行了综合排名及分析。研究表明,生命周期理论能为企业综合绩效评价提供有效途径,熵权法能客观对各指标进行赋权,二者结合可有效评价企业绩效,为企业提供一定的实践
期刊
摘要:民间手工工艺美术是劳动人民为了既可以满足生活的需  要,又能达到一定的审美要求而诞生的一种艺术,它在漫长的生产实践中形成了一些特有的特点——材料简单、手工生产等。这些来自民间的艺术品不仅满足了人们的心理需求和精神需求,更体现了深蕴的文化传统,体现着一个民族的文明智慧和艺术心智,它是民族文化的真实续存。本文对手工工艺制作这个非物质文化遗产的发展时机、改革与创新以及它对中职教育的作用进行了阐述。
期刊
摘要:目前,电网信息化及智能化随着人民日益增长的物质文化需要而高速发展,不断对电力企业提出更高要求。为此,国家电网公司提出“三集五大”(人力资源、财务、物资集约化管理,构建大规划、大建设、大运行、大检修、大营销)发展战略,此举是国家电网公司深入贯彻落实科学发展观,推进改革创新,服务经济发展方式转变的具体实践;是适应电网发展方式转变,加快建设坚强智能电网的迫切需要;是深化国家电网公司发展方式转变,建
期刊
摘要:复合型高素质的师资队伍建设是高职商务英语人才培养  的关键因素。本文解析了高职商务英语师资队伍在职称结构、教师专业背景、兼职教师以及双师培养等方面的现状和存在的问题,提出了加强英语师资队伍建设的途径与措施。  关键词:复合型商务英语师资 双师型教师 专业背景  自1999年高校扩招以来,高职院校纷纷开设商务英语专业,商务英语师资建设成为研究关注的重点,然而此类研究大多仅限于理论探讨,缺乏详实
期刊
摘要:随着数字信息的发展,现在人们对计算机对图像的识别与处理越来越关注。本文通过分析计算机对EAN_13商品条形码的解析,来阐述计算机对图像分析的一般步骤和一些关键算法。  关键词:EAN_13 图像处理  1 EAN_13条形码概述  EAN_13条形码是一种常用的商品条形码,目前大多数商品上标有的条形码就是此种码制。改条形码是由一系列条、空及字符组成,调和空有序排列,蕴含着数字信息。而特定的数
期刊
摘要:创新性思维是人们从事创新时头脑中发生的思维活动,而思维定势经常会成为创新性思维的严重障碍。TRIZ理论提供了更多的、独到的克服思维惯性的创新思维方法,包括智能小人法、STC算子、金鱼法、九屏幕法等。  关键词:创新性思维 TRIZ 九屏幕法 STC算子  创新性思维是反映事物本质属性和内在、外在联系,具有新颖的广义模式的一种可以物化的思想活动,就是人们从事创新时头脑中发生的思维活动,它具有主
期刊
摘要:本文从界定学生骨干的范围与学生骨干的基本特点切入,初步分析了当前学生骨干培养存在的问题,确立了学生骨干培养的基本理念,探索总结了学生骨干培养的路径。  关键词:学生骨干 培养路径 问题及对策  1 学生骨干的界定和分类  目前,部分研究将学生骨干与学生干部、学生领袖等同,如何建华在《试论大学生骨干队伍的建设与培养》一文中、周汉鸣在《当前大学生骨干培养的主要问题与对策研究》中,均持此观点。而根
期刊