【摘 要】
:
随着大数据时代的来临,为了提高计算效率,Wang等(2018)提出基于logistic回归的最优子抽样算法,在保证参数估计精度的前提下,节省了大量的运算时间.为解决变量间的多重共线性,文章提出基于岭回归模型的最优子抽样算法,并证明岭回归模型中参数估计的一致性与渐近正态性.利用数值模拟与实证分析对最优子抽样算法进行评估,结果表明,利用最优子抽样构建的模型与全样本构建的模型在参数估计的精度相近,并大幅减少了运算时间.
【机 构】
:
青岛大学经济学院,青岛266100
论文部分内容阅读
随着大数据时代的来临,为了提高计算效率,Wang等(2018)提出基于logistic回归的最优子抽样算法,在保证参数估计精度的前提下,节省了大量的运算时间.为解决变量间的多重共线性,文章提出基于岭回归模型的最优子抽样算法,并证明岭回归模型中参数估计的一致性与渐近正态性.利用数值模拟与实证分析对最优子抽样算法进行评估,结果表明,利用最优子抽样构建的模型与全样本构建的模型在参数估计的精度相近,并大幅减少了运算时间.
其他文献
函数型参数在制造过程中以“曲线”形式变化,其对质量特性的影响与传统的标量型参数显著不同.提出一种适用于函数型参数的实验设计建模及优化方法.首先分析函数型参数的定义域表现形式,通过基函数展开对其进行自身建模;其次,以最小二乘支持向量回归机(LS-SVR)为基本拟合模型,构造“内-外”双层嵌套结构:内层是函数型参数的B-样条曲线基函数展开模型,外层则是函数型参数,标量型参数与质量特性之间的全局性作用关系模型.通过对LS-SVR的Gaussian核函数的距离度量改进,将内层模型嵌套入外层模型;第三,利用超拉丁方
考虑集装箱码头在实际作业中岸桥故障频发,研究了在某集装箱码头确定泊位上单艘船舶的岸桥多阶段再调度问题.针对岸桥故障场景多变的特征,设计了变长滚动的多阶段再调度机制;重点考虑作业岸桥的故障对该船岸桥调度方案的影响,兼顾作业岸桥装卸过程中不可跨越和保持安全距离等现实条件以及因岸桥故障引起的约束,构建了以岸桥最大完工时间最小为目标的线性规划模型,得出每个滚动阶段决策点处最优的岸桥再调度方案;针对模型的动态性设计了嵌入基因修复和解空间切割的两阶段量子差分进化算法.通过数值实验,验证了方案及算法的有效性,并分析了岸
受多种因素影响,人口普查结果不可避免地偏离真实人口总数,如何构造一个统计性质优良,适用范围广的人口总数估计量,精准把握人口变动趋势是政府统计工作的重要议题.本文解读了英国统计局普查年人口总数估计的经验方法,据此提出三系统估计量与比率估计量组合的人口总数估计方法.模拟研究结果表明,在人口总体合理分层的基础上,新方法能较好地克服由于两系统不独立而引起的交互作用偏差问题,提高人口总数估计量的精度.同时,文章的研究也提出了“第三套人口统计数据资源”的建设思路,这既是构建和应用三系统估计量的数据基础,也有助于进一步
传统的绿色供应链主要目的 是应对已知和潜在的供应链环保风险,而通过上下游企业的绿色研发,可以创造新的价值,从而实现供应链的可持续发展.为对比分析供应链绿色研发模式对上下游经济效益的影响,基于一个零部件供应商和一个生产商构建博弈模型.基于此博弈模型,对比分析四种绿色研发模式(供应商单独绿色研发模式、生产商单独绿色研发模式、双方同时绿色研发模式和集中决策时绿色研发模式)对单位研发努力程度、单位产品零售价格、需求量和收益影响.研究主要得到:在集中决策时绿色研发模式下,单位绿色研发努力程度最大,双方同时绿色研发模
随着能源商品金融化的不断加深,能源金融成为一个新兴的前沿领域,开始受到国内外学者的广泛关注.本文首次较全面地梳理了能源金融理论的发展脉络,从能源价格驱动因素、能源市场建模与预测、能源资产定价与套期保值、能源-商品-金融市场相关性、能源行业投融资以及能源公司金融六个方面描述了能源金融的研究进展,凝练出各方向的研究热点.进一步,本文提出了大数据能源金融、人工智能+能源金融以及能源金融与能源安全三个前沿研究方向.通过本文的梳理,对当前的能源金融理论与实证研究进行了系统的阐述,能够为推动能源金融理论的发展提供借鉴
抽样调查是研究如何从全体被调查对象(即总体)中抽取一部分(即样本),以及如何根据所得到的样本数据对总体的目标量进行推断的一个统计学分支,具有十分广泛的应用价值.在大数据时代,人们收集和存储数据的能力得到了极大提高,获取数据的技术手段不断更新,为抽样调查技术提供了更为广阔的发展空间.当前,大数据背景下抽样调查理论和技术如何演进,已成为新形势下学术界关注的焦点.为推动大数据时代抽样调查的研究和发展,展示该领域理论和应用的最新进展,促进同行之间的学术交流与合作,我们组织了“大数据背景下的抽样理论与质量管理”这期
电站与传动系统是半潜式平台电力的重要来源和主要输送通道.由于电站与传动系统构成复杂,且故障样本少,一般可靠性评估方法无法准确分析出其系统可靠性随时间的变化情况.提出一种结合状态转移抽样与BP神经网络的时变可靠性分析模型,通过状态转移抽样为BP神经网络的时变可靠性计算提供足够的训练数据,并以BP神经网络高效的学习能力提升状态转移抽样在复杂系统可靠性分析中的计算效率和精确度.以D90半潜平台为工程背景,收集整理了电站与传动系统的故障数据,通过该模型计算了系统的三项可靠性指标,并验证了在相同抽样间隔下该模型比单
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是借助网络开展调查或进行社交网络数据的收集,发展出一些无抽样框的非概率抽样方法,能够以低廉的成本在短时间内获得大量分析样本.三是综合大数据与抽样调查的优势,进行线上、线下调查数据的融合,文章针
作为最清洁的化石能源,天然气的使用越来越广泛.然而其价格波动将影响天然气行业的投资与需求、导致生产成本管理困难并影响能源政策的制定和经济增长等.因此,充分了解天然气的价格决定机制及未来波动趋势至关重要.研究利用动态贝叶斯网络模型(dynamic Bayesian network,DBN)研究Henry Hub天然气现货价格的波动机制并预测价格波动率.作为研究结果,建立了天然气现货价格形成机制的动态因果网络图,全面展示了驱动价格形成的直接因素与间接因素.预测结果给出了未来24个月天然气现货价格波动率的取值范
抽样调查在大数据时代仍是不可或缺的研究工具.然而,传统调查方式当前面临执行成本增加与数据质量降低的双重挑战.作为降低受访者负担的有效途径,问卷分割设计逐渐受到研究者重视.文章研究针对问卷分割设计中的子问卷分配过程展开讨论:在假设受访者招募服从泊松过程前提下,以降低协变量的子样本间差异为目标设计成组序贯随机过程.理论和数值分析显示该过程相较现有随机化方法具有优良的表现,可以更好地平衡子样本间协变量差异并提高估计量的估计精度.