论文部分内容阅读
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间的回归模型的数学表达式;(2)求出回归方程;(3)利用回归方程进行预报,同时从残差、相关指数和残差分析角度探讨回归模型的拟合效果.
一、判断两个变量的正或负相关
判断两个变量是正相关还是负相关,有三种常用方法. (1)利用散点图. (2)利用相关系数[r]的符号,当时,正相关;当时,负相关. (3)在已知两变量的线性相关关系时,也可以利用回归直线方程判断,当时,是增函数,两变量正相关;当时,是减函数,两变量负相关.
例1 变量[X]与[Y]相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量[U]与[V]相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). [r1]表示变量[Y]与[X]之间的线性相关系数,[r2]表示变量[V]与[U]之间的线性相关系数,则( )
解析 对于变量[Y]与[X]而言,[Y]随[X]的增大而增大,故[Y]与[X]正相关,即;对于变量[V]与[U]而言,[V]随[U]的增大而减小,故[V]与[U]负相关,即,所以有答案 C
例2 在一组样本数据不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
解析 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
答案 D
例3 设两个变量x和y之间具有线性相关关系,它们的相关系数是[r],y关于x的回归直线的斜率是[b],纵截距是[a],那么必有( )
A.[b]与[r]的符号相同 B.[a]与[r]的符号相同
C.[b]与[r]的符号相反 D.[a]与[r]的符号相反
答案 A
二、体会最小二乘估算的思想方法
三、线性回归分析
对具有相关关系的两个变量进行统计分析时,首先作出散点图,然后进行相关性检验. 或直接利用相关系数进行相关性检验. 在确认具有线性相关关系后,再求回归直线方程.
例5 某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
(1)画出散点图;
(2)求回归直线方程;
(3)试预测广告费支出为10百万元时,销售额多大?
解析 (1)根据表中所列数据可得散点图如下:
(2)列出下表,并用科学计算器进行有关计算.
因此,所求回归直线方程是.
(3)据上面求得的回归直线方程,当广告费支出为10百万元时,
即这种产品的销售收入大约为82.5百万元.
例6 某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2012年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,如下表:
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻的2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?
解析 (1)设抽到不相邻的两组数据为事件[A],因为从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数.
每种情况都是可能出现的,事件[A]包括的基本事件有6种,所以.
所以选取的2组数据恰好是不相邻2天数据的概率是[35].
所以y关于x的线性回归方程为.
所以,该研究所得到的回归方程是可靠的.
一、判断两个变量的正或负相关
判断两个变量是正相关还是负相关,有三种常用方法. (1)利用散点图. (2)利用相关系数[r]的符号,当时,正相关;当时,负相关. (3)在已知两变量的线性相关关系时,也可以利用回归直线方程判断,当时,是增函数,两变量正相关;当时,是减函数,两变量负相关.
例1 变量[X]与[Y]相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量[U]与[V]相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). [r1]表示变量[Y]与[X]之间的线性相关系数,[r2]表示变量[V]与[U]之间的线性相关系数,则( )
解析 对于变量[Y]与[X]而言,[Y]随[X]的增大而增大,故[Y]与[X]正相关,即;对于变量[V]与[U]而言,[V]随[U]的增大而减小,故[V]与[U]负相关,即,所以有答案 C
例2 在一组样本数据不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为( )
解析 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
答案 D
例3 设两个变量x和y之间具有线性相关关系,它们的相关系数是[r],y关于x的回归直线的斜率是[b],纵截距是[a],那么必有( )
A.[b]与[r]的符号相同 B.[a]与[r]的符号相同
C.[b]与[r]的符号相反 D.[a]与[r]的符号相反
答案 A
二、体会最小二乘估算的思想方法
三、线性回归分析
对具有相关关系的两个变量进行统计分析时,首先作出散点图,然后进行相关性检验. 或直接利用相关系数进行相关性检验. 在确认具有线性相关关系后,再求回归直线方程.
例5 某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:
(1)画出散点图;
(2)求回归直线方程;
(3)试预测广告费支出为10百万元时,销售额多大?
解析 (1)根据表中所列数据可得散点图如下:
(2)列出下表,并用科学计算器进行有关计算.
因此,所求回归直线方程是.
(3)据上面求得的回归直线方程,当广告费支出为10百万元时,
即这种产品的销售收入大约为82.5百万元.
例6 某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2012年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,如下表:
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻的2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?
解析 (1)设抽到不相邻的两组数据为事件[A],因为从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数.
每种情况都是可能出现的,事件[A]包括的基本事件有6种,所以.
所以选取的2组数据恰好是不相邻2天数据的概率是[35].
所以y关于x的线性回归方程为.
所以,该研究所得到的回归方程是可靠的.