两个变量间的线性相关及回归方程的求法专题



《两个变量间的线性相关及回归方程的求法专题》由会员分享,可在线阅读,更多相关《两个变量间的线性相关及回归方程的求法专题(12页珍藏版)》请在装配图网上搜索。
1、两个变量间的线性相关及回归方程的求法专题 一、如何认识两个变量间的相关关系 相关关系我们可以从以下三个方面加以认识: (1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系就是函数关系.即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如人的身高与年龄;商品的销售额与广告费等等都是相关关系. (2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系.然而学会新词并不
2、能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些. (3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计. 相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们
3、对函数关系的认识上升到一个新的高度. 二、如何判断两个变量线性相关关系 1、利用变量相关关系的概念 利用变量相关关系的概念判断时,一般是看当一个变量的值一定时,另一个变量是否带有确定性,两个变量之间的关系具有确定关系--函数关系;两个变量之间的关系具有随机性,不确定性--相关关系。 例1、在下列各个量与量的关系中:①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的收入与支出之间的关系;⑤某户家庭用电量与水费之间的关系。其中是相关关系的为 ②③ ③④ ④⑤ ②③④ 解析:①正方体的体积与棱长之间的关系是确定的函数关
4、系;⑤某户家庭用电量与水费之间无任何关系。②③④中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性。 点评:解题的关键是首先分析两个量是否有关系,然后判断这种关系是确定性的关系还是随机的不确定性的关系。 变式练习1:下列关系中是带有随机性的相关关系的有_____。 ①光照时间与果树的亩产量的关系;②圆柱的体积与底面直径的关系;③自由下落的物体的质量与落地时间的关系;④学生的数学成绩与物理成绩。 2、利用散点图 通过散点图观察它们的分布是否存在一定的规律,直观地判断。 例2下面的4个散点图中,两个变量具有相关关系的是( ) A ①②
5、 B ①③ C ②④ D ③④ 解析:由图可知①是一次函数关系,不是相关关系;②的所有点在一条直线附近波动,是线性相关关系;③不具有相关系;④在某曲线附近波动是非线性相关关系,所以两个变量具有相关关系的是②④,故选C. 点评:在考虑两个变量的关系时,可以用画散点图的方法形象直观地反映各对数据的密切程度。 变式练习2:以下是某地搜集到的不同楼盘新房屋的销售价(单位:千元)和房屋面积(单位:平方米)的数据: 房屋面积(平方米) 115 110 80 135 105 销售价格(万元) 248 216 194 292 22 试判断新房屋的销售价(单位
6、:千元)和房屋面积(单位:平方米)之间是否具有相关关系? 3、利用表格 通过观察分析表格中的有关数据,看这些数据是否呈现一定的规律性。 例3、下表是随机抽取的9名15岁的男生的身高与体重,判断所给的两个变量之间是否存在相关关系。 编号 1 2 3 4 5 6 7 8 9 身高(cm) 165 157 155 175 168 157 178 160 163 体重(kg) 52 44 45 55 54 47 62 50 53 解析:由表格不难看出,同一身高157cm对应着不同的体重44kg和47kg,因此体重不是身高的函数
7、关系。将表格中的数据按身高由小到大重新排列,如下表所示,我们不难发现,随着身高的增长,体重基本上呈增加的趋势,因此身高与体重存在着相关关系。 编号 3 2 6 8 9 1 5 4 7 身高(cm) 155 157 157 160 163 165 168 175 178 体重(kg) 45 44 47 50 53 52 54 55 62 点评:这类题目一般是按一定的次序重新排列数据,再看这些数据是否具有规律性。 变式练习3:下表是某地的年降雨量与平均气温,判断两者是否具有相关关系? 年份 2002 2003 2004 20
8、05 2006 2007 2008 年平均气温() 年降雨量() 813 574 701 432 507 677 748 变式练习答案与提示: 1、①②④。 2、画出散点图,可以看出新房屋的销售价(单位:千元)和房屋面积(单位:平方米)呈现一定的规律,所以新房屋的销售价(单位:千元)和房屋面积(单位:平方米)具有相关关系。 3、因为研究的是某地的年降雨量与平均气温,所以按年平均气温从低到高重新排列如下表: 年份 2008 2004 2006 2007 2005 2003 2002 年平均气温()
9、 年降雨量() 748 701 507 677 432 574 813 从表中的数据看某地的年降雨量与平均气温不具有相关关系。 三、回归分析 对于线性回归分析,我们要注意以下几个方面: (1)回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (3)通过散点图的观察,一般地,若图中数据大致分布在一条直线附近,那么这两个变量近似成线性相关关系. (
10、4)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. 四、回归直线方程 1、求回归直线方程的步骤: 第一步:列表,,; 第二步:计算,,,,; 第三步:代入公式计算,的值; 第四步:写出直线方程。 2、范例剖析 例1 测地某地10对父子身高(单位:英寸)如下: 父亲身高() 60 62 64 65 66 67 68 70 72 74 儿子身高() 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 如果与之间具有线性相
11、关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。 分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归直线方程。为了使计算更加有条理,我们通过制作表格来先计算出,,,和;再计算出,,再利用公式和来计算回归系数,最后写出回归直线方程。 解析:先将两个变量的数字在表中计算出来,如下表所示: 序号 1 60 63.6 3600 4044.96 3816 2 62 65.2 3844 4251.04 4042.4 3 64 66 4096 4356 4224 4 65 65.5 4225
12、 4290.25 4257.5 5 66 66.9 4356 4475.61 4415.4 6 67 67.1 4489 4502.41 4495.7 7 68 67.4 4624 4542.76 4583.2 8 70 68.3 4900 4664.89 4781 9 72 70.1 5184 4914.01 5047.2 10 74 70 5476 4900 5180 668 670.1 44794 44941.93 44842.4 由上表可得,,,,。 代入公式得, , 故所求回归直线方程为。
13、 当时,, 所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸。 评注:注意回归直线方程中一次项系数为,常数项为,这与一次函数的习惯表示不同。 例2 有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化。下面是实验的步骤: 机床运转的速度(转/秒) 每小时生产二级品的数量(个) 8 5 12 8 14 9 16 11 (1)作出散点图; (2)求出机床运转的速度与每小时生产二级品数量的回归直线方程; (3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/
14、秒? 分析:散点图形象地反映了各对数据的密切程度,通常在尚未判断两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认具有线性相关关系后,再求其回归直线方程。 解析:(1)散点图如下图所示: (2)易求得,,=0.7286,=-0.8571, ∴所求回归直线方程为。 (3)依题意,要使,只要0.7286-0.857110,解得14.9013,即机床的运转速度不能超过14.9013转/秒。 评注:利用最小二乘法求线性回归直线方程有着广泛的应用,请同学们联系实际,熟练掌握。 3、知能展示 1.为了研究三月下旬的平均气温()与四月二十号前棉花害虫化蛹高峰日()的关
15、系,某地区观察了1996年至2001年的情况,得到下面的数据: 年 份 1996 1997 1998 1999 2000 2001 24.4 29.6 32.9 28.7 30.3 28.9 (天) 19 6 1 10 1 8 据气象预测,该地区在2002年三月下旬平均气温为,试估计2002年四月化蛹高峰日为哪天。 2.某地区第一年到第六年的用电量与年次的统计数据如下表: 用电单位:亿度 年次 1 2 3 4 5 6 用电量 10.4
16、11.4 13.1 14.2 14.8 15.7 (1)与是否具有线性相关关系? (2)如果与具有线性相关关系,求回归直线方程。 答案: 1.提示:估计该地区2002年4月12日或13日为化蛹高峰日。 2.(1)线性相关;(2) 五、相关性和最小二乘估计易错点例析 根据统计数据作出散点图,判定两个变量且有线性相关关系,然后利用最小二乘法求出回归直线方程,并利用回归方程进行预测和估计,这是一个完整的双变量统计的过程。在这一统计分析过程中,有以下几点易于出错,初学者要特别注意。 一、把函数关系当作相关关系 例1、下列两变量中具有相关关系的是( ) (
17、A)正方体的体积与边长;(B)匀速行驶的车辆的行驶距离与时间; (C)人的身高与体重; (D)人的身高与视力 错解:选(A)或(B)。 分析:函数关系的两个变量之间是一种确定的关系,而相关关系的两个变量之间是一种不确定的关系,因此,不能把相关系等同于函数关系。本例中,(A)和(B)都是函数关系,(D)则无相关关系。 正解选(C)。 例2、下列各关系中,不属于相关关系的是( ) (A)名师出高徒 (B)球的表面积与体积 (C)家庭的支出与收入 (D)人的年龄与体重 错解:选(A)。 分析:函数关系是一种因果关系,但相关关系不一定是因果关系。有名的老师能教出高明的徒弟,通常
18、情况下,高水平的老师有很大的趋势教出高水平的学生,但是,高水平的老师所教的学生不一定都是高水平的,也就是说,他们之间没有困果关系的,但有相关关系。 正解选(B),球的表面积与体积之间是函数关系。 二、把不相关或非线性相关当作线性相关 例3 下表是某地的年降雨量与年平均气温,能否根据这些数据估计年平均气温为13.69℃时的年降雨量? 年平均气温(℃) 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量(mn) 748 542 507 813 574 701 432 错解:按照最小二乘法可求出这两个变量之间的线性回归
19、方程,进而计算出估计值; 分析:以x轴为年平均气温,y轴为年降雨量,作出相应的散点图如下: 可以发现图中各点并不在一条直线的附近,所以两者不具有相关关系,没必要用回归直线进行拟合,用最小二乘法公式求得回归直线也是没有意义的。 例4 某机构曾研究温度对某种细菌的影响,在一定温度下,经x单位时间,细菌的数量指数为y,数据如下: (1,2) (2,5) (3,10) (4,17) (5,26) (6,37) (7,50) (8,65) (9,82) (10,101) 问:关于这两个变量的关系,你能得出什么结论? 错解:判断两个变量是线
20、性相关,按最小二乘法的步骤,求出线性回归方程; 分析:事实上我们观察可以发现2=12+1,5=22+1,10=32+1,,17=42+1,,26=52+1,……,因此,我们可以认为x与y之间的关系是y=x2+1,并非是线性相关关系。 避免这类错误的方法很简单,那就是根据已经数据作出散点图,进行曲线拟合,从而判断两个变量是线性相关还是非线性相关或不相关。 三、把估计值当作实际值 例5 一位母亲记录了她儿子3到9岁的身高,数据如下表: 年龄(岁) 3 4 5 6 7 8 9 身高(㎝) 94.8 104.2 108.7 117.8 124.3 130.8
21、139.0 由此她用最小二乘法求出了身高y与年龄x的回归直线方程,并预测儿子10岁时的身高,则下列的叙述正确的是( ) (A) 儿子10岁时的身高一定是145.83㎝ (B) 儿子10岁时的身高在145.83㎝以上 (C) 她儿子10岁时的身高在145.83㎝左右 (D) 她儿子10岁时的身高在145.83㎝以下 错解:(A) 分析:显然,年龄与身高之间是一种相关关系,利用最小二乘法求出的回归方程是对两个变量的最佳线性拟合,我们可以利用回归方程对数量变化做出预测,但这只是估计事物发展的一个最可能出现的结果,并非一定出现。实际上,身高并非只由年龄一个因素决定,儿子10岁时的身高
22、比预测值有误差也是正常的,正确答案为(C)。 四、计算失误 例6已知回归直线的回归系数b的估计值是1.23,=5,=4,则回归直线的方程是( ) (A)=1.23x+4 (B)=0.9425x+1.23 (C)=1.23x+0.08 (D)=0.08x+1.23 错解:(B) 分析:回归直线方程为=bx+a,其中b是回归系数,而一次函数的习惯写法为y=ax+b,错解把它们混淆了。对回归方程=bx+a有a=-b,即=b+a,因此回归直线一定经过点(,)。正确答案为(C)。 例7 为分析初中升学的数学成绩对高一学生学习情况的影响,在高一年级
23、学生中随机抽取了10名学生,他们的入学成绩与期末考试成绩如下表: 学生编号 1 2 3 4 5 6 7 8 9 10 入学成绩 63 67 45 88 81 71 52 99 58 76 期末成绩 65 78 52 82 92 89 73 98 56 75 (1) 若变量与之间具有线性相关关系,求出回归直线的方程; (2) 若某学生的入学成绩为80分,试估计他的期末成绩. 错解: (1). . . . 故所求线性回归直线方程是. (2)某学生入学成绩为80分,代入上式可求得。显然这是不符合实际的。 分析
24、:错解求出a、b后,把回归直线方程公式中=bx+a的a、b位置互换了;事实上,回归方程应为,把这个学生的入学成绩80代入这个方程可出,即这个学生期末成绩的预测分值约为84分。 一般地,用最小二乘法求回归直线方程的步骤为:第一步:列表;第二步:列表计算;第三步:代入公式计算的值;第四步:写出直线方程。其中的数据计算往往要借助计算器或计算机来完成,因此在数据输入时也细心核对,防止出错。 《变量间的相关关系》练习一 一.选择题 1.以下两变量之间具有相关关系的是( ) A.正方形的体积与边长 B,人的身高与体重 C.匀速行驶车辆的行
25、驶路程与时间 D,球半径与表面积。 2.西瓜藤的的长短与西瓜的产量( ) A.确定性关系 B,相关关系 C,函数关系 D,无任何联系。 3.下列说法正确的是( ) A.任何两个变量都具有相关关系 B,光照时间和果树的单产量不具有相关关系。 C.农作物的产量与施肥量之间是一种确定性关系 D.某产品的产量与其销售之间是一种非确性关系。 4.有关线性回归的说法,不正确的是 ( ) A.相关关系的两个变量不是因果关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系
26、 D.任一组数据都有回归方程 5.r是相关系数,则结论正确的个数为 ①r∈[-1,-0.75]时,两变量负相关很强 ②r∈[0.75,1]时,两变量正相关很强 ③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般 ④r=0.1时,两变量相关很弱 A.1 B.2 C.3 D.4 6.散点图的作用( ) A.查找个体个数 B,比较个体数据大小关系 C.探究个体分类 D,粗略判断变量是否具有相关关系 二.填空题 7.现有5组数据、、、、,去掉
27、 组数据后,剩下的4组数据的线性相关性最大. 8.有一组独立观测据,则回归直线方程=bx+a的系数b=____。 9.线性回归方程=bx+a过定点________. 10.对于回归方程:,则a=________。 三.解答题 11. 假设关于某种设备的使用年限和支出的维修费用(万元),有以下的统计资料: 使用年限 2 3 4 5 6 维修费用 2.2 3.8 5.5 6.5 7.0 (1)画出散点图;(2)求支出的维修费用与使用年限的回归方程; (3)估计使用年限为10年时,维修费用是多少? 12.
28、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生 产能耗 (吨标准煤)的几组对照数据 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性 回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:) 《变量间的相关关系》练习二
29、一.选择题 1.下面哪些变量是相关关系( ) A.出租车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁的大小与质量 2.单位产品成本与其产量的相关关系;单位产品成本与单位产品原材料消耗量的相关关系( ) A.前者是正相关,后者是负相关 B.前者是负相关,后者是正相关 C.两者都是正相关 D.两者都是负相关 3.在下列各图中,每个图的两个变量具有相关关系的图是( ) (1) (2) (3) (4)
30、 A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3) 4. 某校经济管理类的学生学习《统计学》的时间(x)与考试成绩(y)之间建立线性回归方程=a+bx.经计算,方程为=20-0.8x,则该方程参数的计算 ( ) A.a值是明显不对的 B.b值是明显不对的 C.a值和b值都是不对的 D.a值和b值都是正确的 二.填空题 5.
31、实验测得四组的值为,则与的回归直线方程 . 6.已知回归方程=4.4x+838.19,则可估计x与y的增长速度之比约为________. 三.解答题(数据处理可借助计算器) 7.已知10只狗的血球体积及红血球的测量值如下 x 45 42 46 48 42 35 58 40 39 50 y 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72 x(血球体积,mm),y(血红球数,百万) (1) 画出上表的散点图;(2)求出回归直线并且画出图形 (3)回归直线必经过的一点是哪一点? 8.某市近10年的煤气消耗量与使用煤气户数的历史资料如下: 年 份 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 x用户(万户) 1 1.2 1.6 1.8 2 2.5 3.2 4 4.2 4.5 y (百万立米) 6 7 9.8 12 12.1 14.5 20 24 25.4 27.5 (1)检验是否线性相关;(2)求回归方程; (3)若市政府下一步再扩大5千煤气用户,试预测该市煤气消耗量将达到多少.
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 36个关键词详解2025政府工作报告
- 学习2025年政府工作报告中的八大科技关键词
- 2025年政府工作报告要点速览接续奋斗共谱新篇
- 学习2025政府工作报告里的加减乘除
- 深化农村改革党课ppt课件(20250305)
- 弘扬雷锋精神凝聚奋进力量学习雷锋精神的丰富内涵和时代价值
- 深化农村改革推进乡村全面振兴心得体会范文(三篇)
- 2025年民营企业座谈会深度解读PPT课件
- 领导干部2024年述职述廉述责述学述法个人报告范文(四篇)
- 读懂2025中央一号党课ppt课件
- 2025年道路运输企业主要负责人安全考试练习题[含答案]
- 2024四川省雅安市中考英语真题[含答案]
- 2024湖南省中考英语真题[含答案]
- 2024宁夏中考英语真题[含答案]
- 2024四川省内江市中考英语真题[含答案]