论文部分内容阅读
摘要:知识探究、注意点
关键词:相关系数;条件概率;独立性检验
【中图分类号】O213
一、知识探究
(一)回归分析
1.相关系数:与函数关系(确定关系)不同,相关关系是一种不确定性关系。从散点图上看,如果散点分布在从左下角到右上角的区域内,这两个变量的相关关系称为正相关,如果散点分布在从左上角到右下角的区域内,这两个变量的相关关系称为负相关。如果这些点从整体上看大致分布在一条直线的附近,则称这两个变量具有线性相关,这条直线叫回归直线。回归直线是:
其中
b是回归直线方程的斜率,a是截距。回归直线总通过点 。
线性相关系数: 时认为有很强的线性相关。
2.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如:是否存在线性关系等等);(3)由经验确定回归方程的类型(如呈线性关系,则运用线性回归方程;(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等等),若存在异常,则应检查数据是否有误,或者是选用的模型是否合适。
3.线性相关强弱通过求相关系数r来判断。通常当|r|>0.75时认为有很强的线性相关关系。
4.两个模型的拟合效果比较:通常利用R2来比较两个拟合的效果,如果R2越大,拟合的效果越好;也可以用残差平方和来比较,残差平方和越小,拟和效果越好。
(二)独立性检验
1.条件概率与独立事件:(1)条件概率:设A和B为两个事件,P(A)>0,那么,在“A已发生”的条件下,B发生的条件概率P(B|A)读作A 发生的条件下 B 发生的概率. 。 由这个定义可知,对任意两个事件A、B,若 ,则有P(AB)=P(B|A)·P(A)。如果B,C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A);(2)独立事件:一般的,对于两个事件A,B,如果P(AB)=P(A)P(B),则称A,B相互独立。如果A,B相互独立,则A与 与B, 与 也相互独立。
2.独立性检验的基本方法:一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表如下:
若要推断的论述为H1:“X与有关系Y”,可以按如下步骤判断结论H1成立的可能性:
(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种方法无法精确的给出所得结论的可靠程度。①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线的两个柱形高度的乘积bc相差越大, H1成立的可能性就越大。②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例 ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例 ,两个比例的值相差越大, H1成立的可能性就越大。
二、知识注意点
1.求线性回归方程的注意点:
(1.回归直线方程中一次项系数为b,常数项a,这与一次函数的表示习惯不同;(2.散点图形象地反映了各对数据的密切程度,在研究两个变量之间的关系时,首先要根据散点图来大致判断它们是否线性相关,是否可以用线性回归模型来拟合数据,若具备线性相关系数再求回归方程;如果本身不具备线性相关关系,或者说,它们之间线性相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估計和预测的量也是不可信的。
2.对相对关系的理解应当注意以下几点:
①相关关系是非随机变量与随机变量之间的关系,而函数关系可以看成是两个非随机变量之间的关系,因此,不能把相关关系等同于函数关系。②函数关系是一种因果关系。而相关关系不一定是因果关系,也可能是伴随关系。例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而,学会新词并不能使脚变大,而涉及到第三个因素—年龄。当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大。
3.求概率的注意点
(1)探求一个事件发生的概率,关键是分清事件的性质。在求解过程中常应用等价转化思想和分解(分类或分步)转化思想处理,把所求的事件:转化为等可能事件的概率(常常采用排列组合的知识);转化为若干个互斥事件中有一个发生的概率;利用对立事件的概率,转化为相互独立事件同时发生的概率;看作某一事件在n次实验中恰有k次发生的概率,但要注意公式的使用条件。(2)事件互斥是事件独立的必要非充分条件,反之,事件对立是事件互斥的充分非必要条件;(3)概率问题的解题规范:①先设事件A=“…”, B=“…”;②列式计算;③作答。
4.独立性检验的注意点
(1) 应根据采集的样本数据,利用公式计算K2的值,比较K2与临界值的大小关系,来判定A与B是否有关;(2)使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,为此在选取样品时,容量一定要适当。
关键词:相关系数;条件概率;独立性检验
【中图分类号】O213
一、知识探究
(一)回归分析
1.相关系数:与函数关系(确定关系)不同,相关关系是一种不确定性关系。从散点图上看,如果散点分布在从左下角到右上角的区域内,这两个变量的相关关系称为正相关,如果散点分布在从左上角到右下角的区域内,这两个变量的相关关系称为负相关。如果这些点从整体上看大致分布在一条直线的附近,则称这两个变量具有线性相关,这条直线叫回归直线。回归直线是:
其中
b是回归直线方程的斜率,a是截距。回归直线总通过点 。
线性相关系数: 时认为有很强的线性相关。
2.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如:是否存在线性关系等等);(3)由经验确定回归方程的类型(如呈线性关系,则运用线性回归方程;(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等等),若存在异常,则应检查数据是否有误,或者是选用的模型是否合适。
3.线性相关强弱通过求相关系数r来判断。通常当|r|>0.75时认为有很强的线性相关关系。
4.两个模型的拟合效果比较:通常利用R2来比较两个拟合的效果,如果R2越大,拟合的效果越好;也可以用残差平方和来比较,残差平方和越小,拟和效果越好。
(二)独立性检验
1.条件概率与独立事件:(1)条件概率:设A和B为两个事件,P(A)>0,那么,在“A已发生”的条件下,B发生的条件概率P(B|A)读作A 发生的条件下 B 发生的概率. 。 由这个定义可知,对任意两个事件A、B,若 ,则有P(AB)=P(B|A)·P(A)。如果B,C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A);(2)独立事件:一般的,对于两个事件A,B,如果P(AB)=P(A)P(B),则称A,B相互独立。如果A,B相互独立,则A与 与B, 与 也相互独立。
2.独立性检验的基本方法:一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表如下:
若要推断的论述为H1:“X与有关系Y”,可以按如下步骤判断结论H1成立的可能性:
(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种方法无法精确的给出所得结论的可靠程度。①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线的两个柱形高度的乘积bc相差越大, H1成立的可能性就越大。②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例 ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例 ,两个比例的值相差越大, H1成立的可能性就越大。
二、知识注意点
1.求线性回归方程的注意点:
(1.回归直线方程中一次项系数为b,常数项a,这与一次函数的表示习惯不同;(2.散点图形象地反映了各对数据的密切程度,在研究两个变量之间的关系时,首先要根据散点图来大致判断它们是否线性相关,是否可以用线性回归模型来拟合数据,若具备线性相关系数再求回归方程;如果本身不具备线性相关关系,或者说,它们之间线性相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估計和预测的量也是不可信的。
2.对相对关系的理解应当注意以下几点:
①相关关系是非随机变量与随机变量之间的关系,而函数关系可以看成是两个非随机变量之间的关系,因此,不能把相关关系等同于函数关系。②函数关系是一种因果关系。而相关关系不一定是因果关系,也可能是伴随关系。例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而,学会新词并不能使脚变大,而涉及到第三个因素—年龄。当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大。
3.求概率的注意点
(1)探求一个事件发生的概率,关键是分清事件的性质。在求解过程中常应用等价转化思想和分解(分类或分步)转化思想处理,把所求的事件:转化为等可能事件的概率(常常采用排列组合的知识);转化为若干个互斥事件中有一个发生的概率;利用对立事件的概率,转化为相互独立事件同时发生的概率;看作某一事件在n次实验中恰有k次发生的概率,但要注意公式的使用条件。(2)事件互斥是事件独立的必要非充分条件,反之,事件对立是事件互斥的充分非必要条件;(3)概率问题的解题规范:①先设事件A=“…”, B=“…”;②列式计算;③作答。
4.独立性检验的注意点
(1) 应根据采集的样本数据,利用公式计算K2的值,比较K2与临界值的大小关系,来判定A与B是否有关;(2)使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,为此在选取样品时,容量一定要适当。