论文部分内容阅读
函数关系是一种确定性关系,相关关系是一种非确定性关系. 回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法. 下面对本节内容的考点作一个总结,希望对大家的学习有所帮助.
相关性的判断
例1 对变量[x],[y]有观测数据[(xi,yi)][(i=1,2,…,10)],得散点图(1);对变量[u],[v]有观测数据[(ui,vi)][(i=1,2,][…,10)],得散点图(2). 由这两个散点图可以判断( )
A. 变量[x]与[y]正相关,[u]与[v]正相关
B. 变量[x]与[y]正相关,[u]与[v]负相关
C. 变量[x]与[y]负相关,[u]与[v]正相关
D. 变量[x]与[y]负相关,[u]与[v]负相关
答案 C
点评 在散点图中,点散布在从左下角到右上角的区域,则两个变量为正相关;点散布在从左上角到右下角的区域,则两个变量为负相关.
样本中心点的性质
例2 两个相关变量满足如下关系:
[[x] 2 3 4 5 6 [y] 25 ○ 50 56 64 ]
根据表格已得回归方程:[y=9.4x+9.2],但表中有一数据模糊不清,请推算该数据是( )
A. 37 B. 38.5 C. 39 D. 40.5
解析 本题主要考查线性回归直线的重要性质——样本点的中心在回归直线上[x=2+3+4+5+65][=4], [y=9.4×4+9.2=46.8]. 设看不清的数据为[a],则[25+a+50+56+64=5y=234],解得,[a=39].
答案 C
点评 回归直线方程一定过样本中心点[(x,y)],这是解题的关键.
回归直线方程的求法
例3 一组数据关系如下所示:
(1)画出散点图;
(2)求纯利[y]与每天销售件数[x]间的回归直线方程;
(3)若该周内某天销售服装20件,估计可获纯利多少元(保留到整数位). (回归直线[y=a+bx]的斜率和截距的最小二乘估计分别为:[b=i=1nxiyi-nxyi=1nxi2-nx2] , [a=y-bx],[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478].)
解析 (1)散点图如图所示.
(2)由散点图知,[y]与[x]有线性相关关系.
∵[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478],[x=6,][y=5597],
∴[a=5597-6×4.75=71914].
∴回归直线方程为[y=4.75x+5597].
(3)当[x=20]时,[y=4.75×20+71914≈146].
因此,本周内某天的销售为20件时,估计这天的纯收入大约为146元.
点评 求回归方程,关键在于求出系数[a],[b]. 由于计算量大,计算时应谨慎仔细,分层进行,避免因计算而产生错误.
非线性回归方程向线性回归方程转化
例4 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费[x](单位:千元)对年销售量[y](单位:[t])和年利润[z](单位:千元)的影响,对近8年的宣传费[xi]和年销售量[yi](i=1,2,3,…,8) 数据作了初步处理,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,[y=a+bx]与[y=c+dx],哪一个适宜作为年销售量[y]关于年宣传费[x]的回归方程类型(给出判断即可,不必说明理由).
(2)根据(1)的判断结果及表中数据,建立[y]关于[x]的回归方程.
(3)已知这种产品的年利润[z]与[x],[y]的关系为[z=0.2y-x],根据(2)的结果回答下列问题:
(i)当年宣传费[x=49]时,年销售量及年利润的预报值时多少?
(ii)当年宣传费[x]为何值时,年利润的预报值最大?并求出最大值.
解析 (1)由散点图可以判断:[y=c+dx]适宜作为年销售量[y]关于年宣传费[x]的回归方程类型.
(2)令[w=x],建立[y]关于[w]的线性回归方程.
由于[d=i=18wi-wyi-yi=18wi-w2=108.81.6=68],
[c=y-dw=563-68×6.8=100.6],
所以[y]关于[w]的线性回归方程为[y=100.6+68w].
因此[y]关于[x]的回归方程为[y=100.6+68x].
(3)(i)由(2)知,当[x=49]时,
年销售量[y]的预报值[y=100.6+6849=576.6],
年利润[z]的预报值[z=576.6×0.2-49=66.32].
(ii)根据(2)的结果知,年利润[z]的预报值
[z=0.2×100.6+68x-x=-x+13.6x+20.12.]
故当[x=13.62=6.8],即[x=46.24]时,[z]取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
点评 回归直线方程类型的选取往往要抓住图形特点,从函数的单调性、凸凹性加以分析. 本题的精妙之处在于通过换元将非线性关系[y=c+dx]转化为线性关系[y=c+dw]后,再作统计分析.
相关系数的求法及应用
例5 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折線图. 由折线图看出,可用线性回归模型拟合[y]与[t]的关系,请用相关系数加以说明.
参考数据:[i=17yi=9.32],[i=17tiyi=40.17],[i=17(yi-y)2]=0.55,[7≈2.646].
解析 由折线图中的数据和附注中的数据得:
[t=4],[i=17(ti-t)2=28],[i=17(yi-y)2=0.55],[i=17(ti-t)(yi-y)][=i=17tiyi-ti=17yi=40.17-4×9.32=2.89],[r≈2.890.55×2×2.646≈0.99].
因为[y]与[t]的相关系数为[0.99],说明[y]与[t]的相关程度相当高,从而可以用线性回归模拟[y]与[t]的关系.
点评 用相关系数[r2]来刻画变量间的相关程度,[r2]的值越小,说明模型的相关程度越低.
相关性的判断
例1 对变量[x],[y]有观测数据[(xi,yi)][(i=1,2,…,10)],得散点图(1);对变量[u],[v]有观测数据[(ui,vi)][(i=1,2,][…,10)],得散点图(2). 由这两个散点图可以判断( )
A. 变量[x]与[y]正相关,[u]与[v]正相关
B. 变量[x]与[y]正相关,[u]与[v]负相关
C. 变量[x]与[y]负相关,[u]与[v]正相关
D. 变量[x]与[y]负相关,[u]与[v]负相关
答案 C
点评 在散点图中,点散布在从左下角到右上角的区域,则两个变量为正相关;点散布在从左上角到右下角的区域,则两个变量为负相关.
样本中心点的性质
例2 两个相关变量满足如下关系:
[[x] 2 3 4 5 6 [y] 25 ○ 50 56 64 ]
根据表格已得回归方程:[y=9.4x+9.2],但表中有一数据模糊不清,请推算该数据是( )
A. 37 B. 38.5 C. 39 D. 40.5
解析 本题主要考查线性回归直线的重要性质——样本点的中心在回归直线上[x=2+3+4+5+65][=4], [y=9.4×4+9.2=46.8]. 设看不清的数据为[a],则[25+a+50+56+64=5y=234],解得,[a=39].
答案 C
点评 回归直线方程一定过样本中心点[(x,y)],这是解题的关键.
回归直线方程的求法
例3 一组数据关系如下所示:
(1)画出散点图;
(2)求纯利[y]与每天销售件数[x]间的回归直线方程;
(3)若该周内某天销售服装20件,估计可获纯利多少元(保留到整数位). (回归直线[y=a+bx]的斜率和截距的最小二乘估计分别为:[b=i=1nxiyi-nxyi=1nxi2-nx2] , [a=y-bx],[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478].)
解析 (1)散点图如图所示.
(2)由散点图知,[y]与[x]有线性相关关系.
∵[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478],[x=6,][y=5597],
∴[a=5597-6×4.75=71914].
∴回归直线方程为[y=4.75x+5597].
(3)当[x=20]时,[y=4.75×20+71914≈146].
因此,本周内某天的销售为20件时,估计这天的纯收入大约为146元.
点评 求回归方程,关键在于求出系数[a],[b]. 由于计算量大,计算时应谨慎仔细,分层进行,避免因计算而产生错误.
非线性回归方程向线性回归方程转化
例4 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费[x](单位:千元)对年销售量[y](单位:[t])和年利润[z](单位:千元)的影响,对近8年的宣传费[xi]和年销售量[yi](i=1,2,3,…,8) 数据作了初步处理,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,[y=a+bx]与[y=c+dx],哪一个适宜作为年销售量[y]关于年宣传费[x]的回归方程类型(给出判断即可,不必说明理由).
(2)根据(1)的判断结果及表中数据,建立[y]关于[x]的回归方程.
(3)已知这种产品的年利润[z]与[x],[y]的关系为[z=0.2y-x],根据(2)的结果回答下列问题:
(i)当年宣传费[x=49]时,年销售量及年利润的预报值时多少?
(ii)当年宣传费[x]为何值时,年利润的预报值最大?并求出最大值.
解析 (1)由散点图可以判断:[y=c+dx]适宜作为年销售量[y]关于年宣传费[x]的回归方程类型.
(2)令[w=x],建立[y]关于[w]的线性回归方程.
由于[d=i=18wi-wyi-yi=18wi-w2=108.81.6=68],
[c=y-dw=563-68×6.8=100.6],
所以[y]关于[w]的线性回归方程为[y=100.6+68w].
因此[y]关于[x]的回归方程为[y=100.6+68x].
(3)(i)由(2)知,当[x=49]时,
年销售量[y]的预报值[y=100.6+6849=576.6],
年利润[z]的预报值[z=576.6×0.2-49=66.32].
(ii)根据(2)的结果知,年利润[z]的预报值
[z=0.2×100.6+68x-x=-x+13.6x+20.12.]
故当[x=13.62=6.8],即[x=46.24]时,[z]取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
点评 回归直线方程类型的选取往往要抓住图形特点,从函数的单调性、凸凹性加以分析. 本题的精妙之处在于通过换元将非线性关系[y=c+dx]转化为线性关系[y=c+dw]后,再作统计分析.
相关系数的求法及应用
例5 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折線图. 由折线图看出,可用线性回归模型拟合[y]与[t]的关系,请用相关系数加以说明.
参考数据:[i=17yi=9.32],[i=17tiyi=40.17],[i=17(yi-y)2]=0.55,[7≈2.646].
解析 由折线图中的数据和附注中的数据得:
[t=4],[i=17(ti-t)2=28],[i=17(yi-y)2=0.55],[i=17(ti-t)(yi-y)][=i=17tiyi-ti=17yi=40.17-4×9.32=2.89],[r≈2.890.55×2×2.646≈0.99].
因为[y]与[t]的相关系数为[0.99],说明[y]与[t]的相关程度相当高,从而可以用线性回归模拟[y]与[t]的关系.
点评 用相关系数[r2]来刻画变量间的相关程度,[r2]的值越小,说明模型的相关程度越低.