基于R&D指标的先导性战略新兴产业发现研究

来源 :财经理论与实践 | 被引量 : 0次 | 上传用户:gaowenjiangy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:战略新兴产业从甄选和发现中产生。具备先导性特征的战略新兴产业将引领我国产业的发展方向。在识别和选择先导性战略新兴产业的过程中,按照其未知、待发掘的特点,透过知识发现的视角,采用关联规则方法,根据R&D经费投入强度指标与专利授权量指标之间的强关联规则关系,建立先导性战略新兴产业数据挖掘关联规则识别模型。以我国长三角地区为实证分析对象,在对该地区的战略新兴产业进行识别时,得出5条符合约束条件的强关联规则,其对应的战略新兴产业的产业顺序分别为高端装备制造、生物医药、新材料、新一代信息技术及新能源等5个产业。
  关键词:先导性战略新兴产业;知识发现;关联规则模型;R&D;专利授权量
  1 引言
  采用科学的识别方法,甄选出符合国情、适合我国经济特征的战略新兴产业尤为重要[1]。战略新兴产业一般要具备全局性、先导性、关联性和动态性等方面的产业特性与经济特性,[2]。不过,由于战略新兴产业都是一些发展时间还不长、产业规模也不大的新兴产业,因此其全局性、关联性和动态性这三个方面的特征,在短期内就不甚明显。至于战略新兴产业的先导性特征,是指该产业对国民经济发展起方向性的引导作用,代表着技术发展和产业结构演进的方向[3]。“先导性”强调的是战略新兴产业能引领我国产业发展战略方向,代表产业的科技创新力乃至我国产业的潜在竞争力。R&D是在科学技术领域,为增加知识总量以及运用知识去创造新的应用进行的系统性的创造活动,R&D投入与水平体现着一国的政治经济实力,企业的R&D则体现着企业的产品和产业竞争力。近些年随着我国对高新技术产业的规划(包括产业园区的建设、产业的引进),对R&D的重视以及经费投入的不断增加,R&D对我国战略新兴产业的先导性作用开始显现[4][5]。虽然目前战略新兴产业在规模和数量方面还不占优势,但其产业先导性特质正日益凸显。本文拟从R&D投入的视角探讨如何甄选和发现先导性战略新兴产业。即采用知识发现功能,通过对有待鉴定的产业的R&D指标数据的归纳、分析和推理,发掘出创新力强、先导性明显的战略性新兴产业。
  数据挖掘是从大量的数据中挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识与规则。这些规则蕴含了数据库中一组对象之间的特定关系,揭示出一些有用的信息,可以为经营决策、市场策划和金融预测等提供依据。数据挖掘已经广泛应用于政府管理、商业经营、科学研究及工业决策等领域 [6]~[11]。由于数据挖掘是知识发现过程的一个步骤,因此在使用过程中,知识发现和数据挖掘二者通常不加以区分的使用。本文基于知识发现的功能来研究战略性新兴产业的识别,采用数据挖掘关联规则发掘战略性新兴产业。依据各产业指标数据库,采取数据挖掘技术识别出潜在的、创新力较强的先导性战略新兴产业。
  本研究依据先导性战略新兴产业的特点确定R&D评价指标之后,采用关联规则方法,结合R&D评价指标所要达到的标准,针对待评价的各个产业R&D评价指标标准不同,寻找某一产业R&D指标水平与各个产业R&D指标平均值的关联关系,确定该产业在该指标水平下具备战略新兴产业的特质。作者曾依据战略新兴产业的全局性、关联性、导向性和动态性特征构建了一套评价指标体系[2][4],本文仍沿用该指标体系,不过着重从产业先导性和创新性的角度进行评价和数据挖掘。
  2 战略新兴产业数据挖掘关联规则模型的建立
  2.1 战略新兴产业知识发现过程
  采用知识发现功能识别战略新兴产业时,其整个过程包括在建立的指标数据库中用数据挖掘算法提取模型,以及围绕数据挖掘所进行的预处理和知识表达等一系列步骤,数据挖掘为整个过程的中心,战略新兴产业知识发现过程的具体步骤包括:
  (1)目标定义:熟悉战略新兴产业识别背景、内涵及特征,了解所要达到的目标及操作的要求;(2)数据选择:从不同的异构数据源中获取各产业不同指标下的数据;(3)数据预处理:由于数据源、数据类型及度量的多样性,会存在一些不完整、错误的、冗余的数据,有必要对错误的数据进行修正或剔除,补充或预测缺失的数据;(4)数据挖掘:采用Apriori算法,从数据中提取出各产业指标数据与指标平均值之间的关联关系,识别具备战略新兴产业特征的产业;(5)知识评估:评价和解释发现的模式,根据需要对知识发现过程中某些阶段进行处理,必要时,反复执行步骤(1)~(5);(6)知识输出:采用可视化方法和知识表现技术将发现的模式展现出来。
  2.2 战略新兴产业数据挖掘关联规则模型的建立
  关联规则挖掘的目的是寻找出数据库中不同数据项集之间隐藏的关联关系,本文研究目的是寻找出有待鉴别各产业在某指标下指标数据与指标平均数据之间的关联关系,有关战略新兴产业数据挖掘关联规则模型建立如下[12]:
  2.3 指标的选取
  以R&D经费投入强度作为判断创新力强、先导性战略地位突出的高新技术产业的重要指标,一直得到了世界范围内的认可。党夏宁[14]、贺正楚、吴艳[15]、董洁[16]的研究也表明,无论是从定性还是定量的角度分析,R&D经费投入指标对于先导性明显、创新力强的新兴产业的支撑和识别,都具备科学的验证性。
  R&D经费投入指标作为识别和支撑战略新兴产业的重要指标,是从资源投入的角度来进行衡量的。在产业实际发展过程中,科研经费的投入对于产业的科研创新支持、员工创新力知识的增强有着不可预知的特征,为此,在识别创新力强的战略新兴产业时,有必要根据R&D经费投入之后所能获得的产出来进行关联分析。专利指标是对产业或企业创新能力进行衡量的重要指标,具有时间序列性和年度产出的特质,R&D经费投入之后,具有一定的时滞性,但专利的出现是创新力与资源投入积累之后的成果,所以,采用专利指标作为战略新兴产业的创新力产出指标是合宜的。由于受利益的驱动,不少专利申请都含有一定的虚假成分,为此,本为所搜集的专利源自于经国家知识产权局和专利局认定之后的专利授权数。故而,本文的研究目标是根据R&D经费投入强度指标与专利授权量指标之间的强关联规则关系,识别出拥有较强创新力的先导性战略新兴产业。   3 实证分析——以长三角地区为例
  3.1基于关联规则的长三角地区战略新兴产业实证研究
  本文采用weka软件对长三角地区战略新兴产业进行关联规则分析,运行环境为Windows XP。
  (1)数据源。根据我国国民经济行业分类(GB/T4754-2002)标准,结合本文研究特点,选取2009年长三角地区共25个城市的战略新兴产业作为实证研究对象,每个城市的产业指标集合作为一条事务。本文针对统计年鉴中的战略新兴产业进行分类:新一代信息技术产业,包括通信设备、计算机及其他电子设备制造业;新材料产业,包括化学原料及化学制品制造业、化学纤维制造业、非金属矿物制品业;新能源产业,包括电力、热力的生产和供应业,石油加工、炼焦及核燃料加工业,燃气生产和供应业;新能源汽车产业,包括电气机械及器材制造业;高端装备制造业,包括专用设备制造业、通用设备制造业、交通运输设备制造业;生物医药产业,包括医药制造业;节能环保产业,包括水的生产和供应业、废弃资源和废旧材料回收加工业。
  “R&D经费投入强度”评价是“战略新兴产业的先导性”指标体系中的一个重要指标[14],本文把该指标作为考察对象,研究长三角地区战略新兴产业的识别,同时,以2009年专利授权量指标作为与R&D发生关联规则分析的产出指标(平均指标)。
  长三角地区战略新兴产业R&D经费投入强度的原始事务数据库,见表1。
  说明:表1数据来源于长三角地区主要城市2009年第二次全国R&D资源清查数据公报及统计年鉴。
  (2)数据预处理。在对数据进行录入之后,由于weka软件关联规则只能处理分类型(nominal)数据,因此,得将数据库中的数值型数据转为分类型数据。例如,本文将产出指标(平均指标)“专利授权增加量”分类为高(high)和低(low)两类,当人均生产总值 7000件时,则为low;人均生产总值 7000元时,则为high。其他各指标数据均划分为3个区间,值域小的落在low区间,值域为一般的或者高的落在medium(中等)或high(高)的区间。实际操作中,数值型数据的分类处理非常关键,划分过粗,区间支持度太大,可能造成规则的置信度下降,以致达不到置信阈值;划分太细,落入每个区间的事务数减少,很难找到满足支持的阈值。由于本文各属性的数据最大值与最小值相差过大,经过多番调试,本文依据最大值将属性数据分为3个区间:low(低),medium(中等),high(高)。下图为启动weka软件打开分类处理后的产业数据表,可以看到,新材料产业(new material industry)的类型(type)为分类型(nominal),且分为low、medium、high三个类型,无缺失值,见图1。
  (3)产业关联规则参数设置与约束条件。本文采用Apriori算法进行计算,计划挖掘出支持度在20%至100%之间,并且lift值超过1.1且lift排前15的关联规则。将参数“lower Bound Min Support”和“upper Bound Min Support”分别设置为0.2和1,“metric Type”设为lift,“min Metric”设为1.1,“num Rules”设置为15,其他选项保持默认即可。约束条件为置信度conf>0.5。
  (4)挖掘结果。在窗口“Explorer”中点击“Start”运行算法,得出R&D指标下长三角地区战略新兴产业数据挖掘结果为(以下列出的为各属性指标与平均指标之间的强关联规则):Minimum support:0.4(10 instances)。Minimum metric :1.1。Number of cycles performed:12。Generated sets of large itemsets:Size of set of large itemsets L(1):28;Size of set of large itemsets L(2):23。
  Best rules found:average value=high 18 smelting and pressing of nonferrous metals=high 10,conf=0.56,lift=1.39;smelting and pressing of nonferrous metals=high 10 average value=high 10,conf=1,lift=1.39;average value=high 18 high-end equipment manufacturing industry,new energy vehicle=high 10,conf=0.56,lift=1.39;high-end equipment manufacturing industry,new energy vehicle=high 10 average value=high 10,conf=1,lift=1.39;average value=high 18 high-end equipment manufacturing industry=high 12,conf=0.67,lift=1.28;high-end equipment manufacturing industry=high 13 average value=high 12,conf=0.92,lift=1.28;average value=high 18 bio-pharmaceutical industry=high 11,conf=0.61,lift=1.27;bio-pharmaceutical industry=high 12 average value=high 11,conf=0.92,lift=1.27;average value=high 18 plastic products=medium 10,conf=0.56,lift=1.26;plastic products=medium 11 average value=high 10,conf=0.91,lift=1.26。   可见,在R&D经费投入强度指标下,挖掘出长三角地区战略新兴产业的产业顺序是:高端装备制造业、生物医药产业、新材料、新一代信息技术及新能源产业。
  3.2结果分析与政策建议
  3.2.1结果分析
  根据本文的数据挖掘结果,确立了以高端装备制造业、生物医药产业、新材料、新一代信息技术及新能源产业为主的战略新兴产业。基于R&D经费投入强度指标,采用知识发现工具,挖掘出与该指标产出目标下的专利授权量指标拥有强关联关系的规则,有利于创新力强的战略新兴产业的识别,这对于我国确立产业的战略发展方向有着重要意义。电子信息产业和装备制造业作为长三角地区的重点发展产业,已经形成了比较完善的产业基地和研发中心,这对于新一代信息技术和高端装备制造的发展有着重要的支撑作用。本文的知识发现过程中也存在一些不足之处,譬如数据的整理:由于目前我国未有针对战略新兴产业的专门产业分类标准,数据搜集比较难,统计年鉴中的数据则比较完整,本文采用将统计年鉴中的产业重新划分进行了关联规则分析,但划分的产业中也存在分类不精确、产业交叉、产业范围扩大化、产业缺失等现象,在此,作者建议国家应尽快出台相关政策对战略新兴产业的统计给予明确定位,这样,对于战略新兴产业的发展可以实施动态的、科学的管理。
  3.2.2政策建议
  (1)在长三角地区实施战略新兴产业R&D效率评价。为了使R&D活动实现由模糊到具体,由静态到动态的管理过程,进一步提升长三角地区战略新兴产业R&D经费的配置效率和利用效率,为此要建立一套科学有效的R&D效率评价指标体系,及时反映R&D经费投入的产出情况和使用效率,以便为政府相关部门及时作出相应的投入决策提供参考依据。在增加R&D经费投入时,也要大力提高R&D经费利用率,科学控制R&D经费和R&D人员投入规模,对有限经费进行合理配置,找出影响R&D效率提高的主要因素,并逐步改善。此外,长三角地区的苏、浙、沪三地各自拥有优势战略新兴产业,因此,可以相互交流借鉴经验,共同提升长三角地区战略新兴产业的R&D效率。
  (2)长三角地区战略新兴产业要尽快达到适度的产业规模。R&D经费投入的增加,要求产出增加的比例超过投入增加的比例。通过合理扩大战略新兴产业规模,在注重产出效率的同时,确保R&D活动持续高效地进行。作为长三角龙头,上海市到2015年要成为在若干领域跻身世界前列的战略新兴产业集聚区,战略新兴产业中高端制造业占工业总产值比重争取达到30%。2015年,江苏省战略新兴产业增加值要占GDP比重的10%,2020年,比重要达到18%。“十二五”期间,浙江省力争战略新兴产业增加值年均增长15%以上,到2015年达到5000亿元左右,占生产总值的比重达到12%左右,到2020年,战略新兴产业增加值占浙江省生产总值的比重接近20%。
  (3)长三角地区要把其省级产业集聚区、省级以上高新技术产业开发区(园区)作为培育发展战略新兴产业的主阵地进行规划建设,要求其战略新兴产业增加值占生产总值的比重每年提高3个百分点以上。省级以上经济开发区(园区)、产业集群示范区则要求每年提高2个百分点以上。
  (4)2006-2009年,长三角地区R&D经费内部支出总额为729.60亿元,发明专利16330件,专利申请数33929项。2006-2009年,长三角地区在产业的R&D投入强度方面(R&D费用/工业总产值),分别是0.9%、0.88%、0.91%、1.19%,虽然总体上呈现出逐年上升的态势,但是却明显低于全国平均水平(2006-2009年,全国平均水平分别是1.09%、1.08%、1.15%、1.28%)。美国在2006年的产业R&D投入强度为16.41%[16]。为了缩小与全国平均水平以及发达国家的差距,长三角地区应加大R&D经费投入的强度。
  参考文献
  [1]彭金荣,李春红.国外战略性新兴产业的发展态势及启示[J].改革与战略,2011,27(2).
  [2]贺正楚,吴艳.战略性新兴产业的评价与选择[J].科学学研究,2011,29(5):678-683.
  [3]贺正楚,张蜜.生物医药产业共性技术路线图研究[J].中国软科学,2012, (7):49-60.
  [4]张良桥,吴艳.基于灰色关联分析的战略性新兴产业评价——以生物医药为例[J].经济数学,2010,27(3):71-77.
  [5]张训.战略性新兴产业的选择与评价及实证分析[J].科学学与科学技术管理,2010(12):62-67.
  [6]Margaret H. Dunham.数据挖掘教程[M].清华大学出版社,2005:8-11.
  [7]Ming-Syan Chen, Jiawei Han, Philip S. Yu. Data Mining: An Overview from a Database Perspective[J]. IEEE Transactions on Knowledge and Data Engineering, 1996,8(6):866-883.
  [8]陈安,陈宁,周龙骧等.数据挖掘技术及应用[M].科学出版社,2006:40-47.
  [9]Rakesh Agrawal, Tomasz Imielinski, Arun Swami. Mining Association Rules Between Sets of Items in Large Databases[J]. ACM SIGMOD,1993.207-216.
  [10]朱东华,袁军鹏.基于数据挖掘的科技监测方法研究[J].管理工程学报,2004,(4):135-139.
  [11]陈士俊,赖迪辉.数据挖掘在科技评估中的应用[J].科学学与科学技术管理,2005,(4):40-43.
  [12]马超群,兰秋军,陈为民.金融数据挖掘[M].科学出版社,2007:57-69.
  [13]吴艳,周震虹.战略性新兴产业评估指标实证遴选及其应用[J].中国科技论坛,2011(5):10-14.
  [14]党夏宁.中国高新技术产业的国际竞争力[J].西安财经学院学报,2009,22(6):80-83.
  [15]贺正楚,吴艳,周震虹.基于知识发现的战略性新兴产业识别研究:兼论“长三角”战略性新兴产业的发展[J].南京财经大学学报,2012,30(4):22-28.
  [16]董洁,张体委.长三角地区高技术产业R&D资源配置效率优化研究[J].科技进步与对策,2012,29(21):49-54.
其他文献
摘要:水资源作为典型的公共品具有很强的外溢性,而且其外溢性具有单向流动的特征,围绕上下游水资源生态补偿引发的流域上下游地方政府间矛盾日益突显。基于演化博弈理论,本文分析我国跨流域上下游地方政府的博弈过程以及影响因素。研究表明,流域上下游地方政府达成合作的局面长期内主要受上游地方政府惩罚值、下游地方政府惩罚值、下游地方政府对上游地方政府的补偿收益以及上游地方政府保护水资源的成本等四个方面因素影响;而
期刊
摘要:本文采用我国2005-2013年64家商业银行的微观数据,运用Hansen发展的面板门槛模型,研究了不同资本充足水平下,资本充足率监管对银行稳健性的影响。面板门槛模型是基于数据本身特点内生划分区间,从而可以有效避免人为划分资本充足水平的偏误。研究结果表明,我国商业银行存在资本充足率监管与银行稳健性的单一门槛效应,二者是非线性关系。此外,上市银行样本中,不论资本充足率位于高水平还是低水平,资本
期刊
[摘 要]以由甘肃、青海、宁夏三个西北地区落后省、区组成的小西北经济区1990~2010年的相关数据为基础,分析农村人力资本水平与城乡收入差距之间的关系。首先采用平均受教育年限法测算农村人力资本水平,其次用组间方差法测算城乡收入差距,经过比较得出二者存在周期性倒“U”型曲线关系,与人们的普遍猜想不一致。这说明农村人力资本水平的提高并没有自始至终地缩小城乡收入差距,进而从人力资本的角度提出缩小城乡收
期刊
摘 要:本文从3个维度选取15个反映2013年城乡基本养老保险制度财务可持续和地区经济发展水平的指标,利用主成分分析法对2013年我国各省市城乡养老保险发展状况进行研究。实证结果表明,东部省份在地区GDP和城镇职工基本养老保险基金可持续性表现较好,西部省份在城乡居民社会保障水平和城乡居民社会养老保险财务可持续上表现良好。西部与中东部省份的差距在缩小,西部省份内部差距明显。研究发现,地区经济发展水平
期刊
摘要:选取2007年1月1日到2014年2月28日为研究区间,观察央行公开市场操作对债券市场的影响,用以判断该货币政策手段所产生的效果。研究发现,在全样本中,无论是放松还是收紧银根的操作,对债券市场的影响均只表现在个别市场,而且影响滞后、较弱。单独研究长期品种操作的结果发现,央行公开市场紧缩操作对债券市场的影响显著,方向与预期一致;而公开市场放松操作在债券市场几乎没有反应,说明没有通过债券市场的传
期刊
摘要:利用2007-2012年上市公司数据,考量不同生命周期阶段开放式创新能力对企业创新绩效的影响。结果显示:不同生命周期阶段开放式创新能力对企业创新绩效的作用存在差异,其中,吸收能力在成长期与成熟期对企业创新绩效显著正相关,在衰退期对创新绩效具有显著负效应;连接能力在成长期与成熟期对创新绩效具有显著正效应,在衰退期与创新绩效呈正相关,但不显著;解吸能力仅在衰退期对企业创新绩效有显著的积极效应,在
期刊
摘 要:以2007~2010年我国A股公司为样本,研究了上市公司在采用公允价值计量方式后是否会产生新的投资异象以及造成这种投资异象的影响因素。运用均值T检验和Wilcoxon符号等级检验,并采用FamaFrench三因素模型对样本公司进行回归。研究发现,在控制了市场风险、规模风险和账面市值比风险之后,投资策略仍然可获得超常回报率,并且公允价值变动损益占净利润比重大(小)的组,超常回报率低(高)。套
期刊
【内容摘要】 我国融资租赁行业自2012年后快速发展但仍有较大发展空间。利用融资租赁谱系图解介绍资本市场融资租赁业务的参与主体后,结合以融资租赁为基础的保理融资业务,本研究构造了二类金融机构在合约过程中的决策机理,用理论模型展示了二类基础牌照联合业务在资源动员过程中比传统金融机构有效。研究的结论是,非银基础牌照资源的发放权限应该下放到地方政府的金融管理部门。  关键词:非银金融机构 资源动员 融资
期刊
摘要:中国现有在职消费研究“一边倒”的现状是否与转型期特殊的制度背景有关?在职消费的代理理论与效率理论之间是否存在逻辑一致性?鉴于此,以2008~2013年沪市A股制造业为样本,通过将在职消费划分成正常、超额两部分,研究发现:以薪酬管制、冗员负担为代表的制度背景与上市公司高管超额在职消费显著正相关。并且,高管超额在职消费会显著损害企业绩效,而正常在职消费则能显著提升公司业绩,证明调和在职消费两种理
期刊
摘要:分析了巴塞尔III资本监管改革的主要内容和实施计划,在比较巴塞尔III和中国银监会资本监管方案的同时,根据17家上市商业银行2010年的数据测算了新的监管指标对银行业的影响。研究表明,无论从资本充足率角度还是杠杆率角度看,中国银行业的短期资本缺口不大,但长期资本缺口巨大。在监管方面,应加强宏观审慎监管框架的建立和完善,完善动态拨备率制度,加强监管机构之间的合作。  关键词:巴塞尔III;资本
期刊