回归分析考点剖析

来源 :高中生学习·高二版 | 被引量 : 0次 | 上传用户:yanglsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  函数关系是一种确定性关系,相关关系是一种非确定性关系. 回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法. 下面对本节内容的考点作一个总结,希望对大家的学习有所帮助.
  相关性的判断
  例1 对变量[x],[y]有观测数据[(xi,yi)][(i=1,2,…,10)],得散点图(1);对变量[u],[v]有观测数据[(ui,vi)][(i=1,2,][…,10)],得散点图(2). 由这两个散点图可以判断( )
  A. 变量[x]与[y]正相关,[u]与[v]正相关
  B. 变量[x]与[y]正相关,[u]与[v]负相关
  C. 变量[x]与[y]负相关,[u]与[v]正相关
  D. 变量[x]与[y]负相关,[u]与[v]负相关
  答案 C
  点评 在散点图中,点散布在从左下角到右上角的区域,则两个变量为正相关;点散布在从左上角到右下角的区域,则两个变量为负相关.
  样本中心点的性质
  例2 两个相关变量满足如下关系:
  [[x] 2 3 4 5 6 [y] 25 ○ 50 56 64 ]
  根据表格已得回归方程:[y=9.4x+9.2],但表中有一数据模糊不清,请推算该数据是( )
  A. 37 B. 38.5 C. 39 D. 40.5
  解析 本题主要考查线性回归直线的重要性质——样本点的中心在回归直线上[x=2+3+4+5+65][=4], [y=9.4×4+9.2=46.8]. 设看不清的数据为[a],则[25+a+50+56+64=5y=234],解得,[a=39].
  答案 C
  点评 回归直线方程一定过样本中心点[(x,y)],这是解题的关键.
  回归直线方程的求法
  例3 一组数据关系如下所示:
  (1)画出散点图;
  (2)求纯利[y]与每天销售件数[x]间的回归直线方程;
  (3)若该周内某天销售服装20件,估计可获纯利多少元(保留到整数位). (回归直线[y=a+bx]的斜率和截距的最小二乘估计分别为:[b=i=1nxiyi-nxyi=1nxi2-nx2] , [a=y-bx],[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478].)
  解析 (1)散点图如图所示.
  (2)由散点图知,[y]与[x]有线性相关关系.
  ∵[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478],[x=6,][y=5597],
  ∴[a=5597-6×4.75=71914].
  ∴回归直线方程为[y=4.75x+5597].
  (3)当[x=20]时,[y=4.75×20+71914≈146].
  因此,本周内某天的销售为20件时,估计这天的纯收入大约为146元.
  点评 求回归方程,关键在于求出系数[a],[b]. 由于计算量大,计算时应谨慎仔细,分层进行,避免因计算而产生错误.
  非线性回归方程向线性回归方程转化
  例4 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费[x](单位:千元)对年销售量[y](单位:[t])和年利润[z](单位:千元)的影响,对近8年的宣传费[xi]和年销售量[yi](i=1,2,3,…,8) 数据作了初步处理,得到下面的散点图及一些统计量的值.
  (1)根据散点图判断,[y=a+bx]与[y=c+dx],哪一个适宜作为年销售量[y]关于年宣传费[x]的回归方程类型(给出判断即可,不必说明理由).
  (2)根据(1)的判断结果及表中数据,建立[y]关于[x]的回归方程.
  (3)已知这种产品的年利润[z]与[x],[y]的关系为[z=0.2y-x],根据(2)的结果回答下列问题:
  (i)当年宣传费[x=49]时,年销售量及年利润的预报值时多少?
  (ii)当年宣传费[x]为何值时,年利润的预报值最大?并求出最大值.
  解析 (1)由散点图可以判断:[y=c+dx]适宜作为年销售量[y]关于年宣传费[x]的回归方程类型.
  (2)令[w=x],建立[y]关于[w]的线性回归方程.
  由于[d=i=18wi-wyi-yi=18wi-w2=108.81.6=68],
  [c=y-dw=563-68×6.8=100.6],
  所以[y]关于[w]的线性回归方程为[y=100.6+68w].
  因此[y]关于[x]的回归方程为[y=100.6+68x].
  (3)(i)由(2)知,当[x=49]时,
  年销售量[y]的预报值[y=100.6+6849=576.6],
  年利润[z]的预报值[z=576.6×0.2-49=66.32].
  (ii)根据(2)的结果知,年利润[z]的预报值
  [z=0.2×100.6+68x-x=-x+13.6x+20.12.]
  故当[x=13.62=6.8],即[x=46.24]时,[z]取得最大值.
  故年宣传费为46.24千元时,年利润的预报值最大.
  点评 回归直线方程类型的选取往往要抓住图形特点,从函数的单调性、凸凹性加以分析. 本题的精妙之处在于通过换元将非线性关系[y=c+dx]转化为线性关系[y=c+dw]后,再作统计分析.
  相关系数的求法及应用
  例5 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折線图. 由折线图看出,可用线性回归模型拟合[y]与[t]的关系,请用相关系数加以说明.
  参考数据:[i=17yi=9.32],[i=17tiyi=40.17],[i=17(yi-y)2]=0.55,[7≈2.646].
  解析 由折线图中的数据和附注中的数据得:
  [t=4],[i=17(ti-t)2=28],[i=17(yi-y)2=0.55],[i=17(ti-t)(yi-y)][=i=17tiyi-ti=17yi=40.17-4×9.32=2.89],[r≈2.890.55×2×2.646≈0.99].
  因为[y]与[t]的相关系数为[0.99],说明[y]与[t]的相关程度相当高,从而可以用线性回归模拟[y]与[t]的关系.
  点评 用相关系数[r2]来刻画变量间的相关程度,[r2]的值越小,说明模型的相关程度越低.
其他文献
一些优秀的公立医院管理者,他们希望能够以人文精神、价值观注输来驱动员工管理和医院运营,在公立医院治理上寻求突破,丁义涛就属于这批布道者之一。南京鼓楼医院本部有两个
有效地使用氮肥一直是与农民有争议的问题。减少施氮量可以降低甜菜生产成本,同时还改善了甜菜的品质,有利于糖厂加工表1列山了1980年以来英国各地种植甜 The effective us
军用轮式车辆作为部队机动的重要手段和车载武器系统的平台,直接制约着部队的机动能力,影响着武器系统战斗效能的发挥。因此,应用新技术,提高军用车辆的机动性,改善其平顺性
近几年来,化州市的安全生产工作持续保持良好势头。据统计,从1991年以来,全市国有和市属集体以上企业在册职工实现了伤亡事故为零,乡镇企业、私营企业、“三资”企业和矿山
中国水稻所卢婉芳等研究结果表明,尿酶抑制剂(NBPT)与尿素混施,能降低尿酶活性,减缓尿素 The results of the research on the results of the study on Chinese rice by L
伴随着经济的全球化发展,信息科技等诸多高科技频繁出现在人们的生产生活中。新型的教学方式逐渐取代了原有的教学理论,然而应试作文的方式已经不能满足现在社会的需求了。于
农村经济改革以来的实践已经证明,农业工程科学技术在中国的农业和农村经济发展中具有不可替代的作用。由于中国的特殊条件,农业工程学科建设必然会有自身的特色,对中国农业
粗心酿出的祸端1996年11月15日,鲁西某县电业公司,将对其所属的一条110千伏H线路进行清扫检修。上午8时整,责任人在办理完工作票后,将43名参加清扫检修的人员召集到一起,由公司一
冲压车间安全生产通则本标准是GB8716-87冲压车间安全生产通则》的修订本,规定了金属冲压车间安全生产的一般方法、要求和准则。在人身保护方面,规定了符合劳动卫生、保障劳动者
通过多年观测资料的分析研究,阐明了半湿润季风气候及有灌溉条件下,土壤剖面中的水盐运动主要是上层1m左右土体的上下垂直运动,表聚性强烈。当潜水埋深>1.5m时,潜水借毛管上