论文部分内容阅读
线性回归问题是新课标中增加的内容之一,具有很强的现实背景和较强的实践性。涉及线性回归问题的试题往往贴近生活实际,富有时代气息,已经成为近几年高考的一大亮点,从近几年的高考试题来看,高考对相关性和最小二乘估计的考查有加强趋势,主要是以散点图与相关关系、相关系数、回归方程的建立与应用为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现,这部分题目往往思路简单,方法单一,计算繁琐。
一、散点图与相关关系的判断
例1 (2013福建)已知x与y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程y^ =b^ x+a^ ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.b^ >b′,a^ >a′ B.b^ >b′,a^ C.b^ a′ D.b^ 分析:在直角坐标系下做出散点图,根据散点图分析两个变量是否存在相关关系,并作出回归直线1,再作出过点(1,0)和(2,2)的直线2,比较两条直线的斜率和截距可得答案.
解析:根据表中六组数据画出散点图,并作出回归直线,如实线所示:
再作出过(1,0)和(2,2)直线,如图中虚线所示。
显然实线斜率小,纵截距大。即:b^ a′.选C.
评注:①散点图直观反映了两变量的成对观测值之间存在的某种关系,利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x和y具有线性相关关系.
②本题也可有最小二乘法计算公式得:b^ =57,a^ =y-b^ x=136-57×72=-13,再由直线的两点式方程可得b′=2,a′=-2,易得C为正确答案。
二、相关系数的大小与相关性强弱的关系.
例2 (2013湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
① y与x负相关且y^=2.347x-6.423;② y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
分析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越高,r为正时正相关,r为负时负相关,r与k符号相同,故k>0时正相关,k<0时负相关.
解析: ①中,回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,∴①④一定不正确.
评注:r的符号反映变量的变化方向,r的大小反映变量的线性相关程度。由相关系数和回归直线的斜率计算公式: r=i=1nxiyi-nxy(i=1nx2i-nx2)(i=1ny2i-ny2),以及最小二乘法中斜率计算公式k=b=i=1nxiyi-n x yi=1nx2i-n x2,得相关系数r和回归直线斜率k 的符号相同,即当r>0时k>0,直线斜率为正,表示两个变量变化方向相同,此时两个变量正相关;当r<0时k<0,直线斜率为负,表示两个变量变化方向相反,此时两个变量负相关.|r|越接近1,表明两个变量的线性相关性越强;当|r|接近0 时,表明两个变量间几乎不存在线性相关关系.
结束语:现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系。借助散点图和最小二乘法,从不同角度描述这种相关关系,从而达到对实际情况的正确估计和预测。认真体会其中蕴含的数学思想,方能悟出数学的应用价值。
(陕西省洋县中学)
一、散点图与相关关系的判断
例1 (2013福建)已知x与y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程y^ =b^ x+a^ ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.b^ >b′,a^ >a′ B.b^ >b′,a^ C.b^ a′ D.b^ 分析:在直角坐标系下做出散点图,根据散点图分析两个变量是否存在相关关系,并作出回归直线1,再作出过点(1,0)和(2,2)的直线2,比较两条直线的斜率和截距可得答案.
解析:根据表中六组数据画出散点图,并作出回归直线,如实线所示:
再作出过(1,0)和(2,2)直线,如图中虚线所示。
显然实线斜率小,纵截距大。即:b^ a′.选C.
评注:①散点图直观反映了两变量的成对观测值之间存在的某种关系,利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x和y具有线性相关关系.
②本题也可有最小二乘法计算公式得:b^ =57,a^ =y-b^ x=136-57×72=-13,再由直线的两点式方程可得b′=2,a′=-2,易得C为正确答案。
二、相关系数的大小与相关性强弱的关系.
例2 (2013湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
① y与x负相关且y^=2.347x-6.423;② y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
分析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越高,r为正时正相关,r为负时负相关,r与k符号相同,故k>0时正相关,k<0时负相关.
解析: ①中,回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,∴①④一定不正确.
评注:r的符号反映变量的变化方向,r的大小反映变量的线性相关程度。由相关系数和回归直线的斜率计算公式: r=i=1nxiyi-nxy(i=1nx2i-nx2)(i=1ny2i-ny2),以及最小二乘法中斜率计算公式k=b=i=1nxiyi-n x yi=1nx2i-n x2,得相关系数r和回归直线斜率k 的符号相同,即当r>0时k>0,直线斜率为正,表示两个变量变化方向相同,此时两个变量正相关;当r<0时k<0,直线斜率为负,表示两个变量变化方向相反,此时两个变量负相关.|r|越接近1,表明两个变量的线性相关性越强;当|r|接近0 时,表明两个变量间几乎不存在线性相关关系.
结束语:现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系。借助散点图和最小二乘法,从不同角度描述这种相关关系,从而达到对实际情况的正确估计和预测。认真体会其中蕴含的数学思想,方能悟出数学的应用价值。
(陕西省洋县中学)