2020届高考数学一轮总复习 第十单元 计数原理 、概率与统计 第79讲 变量的相关性、回归分析、独立性检验练习 理(含解析)新人教A版
《2020届高考数学一轮总复习 第十单元 计数原理 、概率与统计 第79讲 变量的相关性、回归分析、独立性检验练习 理(含解析)新人教A版》由会员分享,可在线阅读,更多相关《2020届高考数学一轮总复习 第十单元 计数原理 、概率与统计 第79讲 变量的相关性、回归分析、独立性检验练习 理(含解析)新人教A版(7页珍藏版)》请在装配图网上搜索。
1、第79讲 变量的相关性、回归分析、独立性检验 1.设某大学的女生的体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是(D) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生的身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生的身高为170 cm,则可断定其体重必为58.79 kg A、B、C均正确,是回归方程的性质.D项是错误的,线性回归方程只能预测学生的体重,选项D应改为“若该大学
2、某女生身高为170 cm,则估计其体重大约为58.79 kg”才正确. 2.(2017·山东卷)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为y =b x+a .已知i=225,i=1 600,b =4.该班某学生的脚长为24,据此估计其身高为(C) A.160 B.163 C.166 D.170 因为i=225,所以=i=22.5. 因为i=1 600,所以=i=160. 又b =4,所以a =-b =160-4×22.5=70. 所以回归直线方程为y
3、 =4x+70. 将x=24代入上式得y =4×24+70=166. 3.下列关于K2的说法中正确的是(C) A.K2在任何相互独立问题中都可以用于检验有关还是无关 B.K2的值越大,两个事件的相关性就越大 C.K2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适合 D.K2的观测值的计算公式为 k= 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K2=算得, K2=≈7.8. 附表: P(K
4、2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确结论是(A) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 解:因为7.8>6.635,所以99%以上的把握认为“爱好该项运动与性别有关”,选A. 5.对于一组数据的两个函数模型,模型Ⅰ和模型Ⅱ的残差平方和分别为180.2和290.7,若从中选取一个拟合
5、程度较好的函数模型,应选 模型Ⅰ . 解:残差平方和越小,函数模型对数据的拟合效果越好;残差平方和越大,说明函数模型对数据的拟合效果越差. 6.已知x、y的取值如下表所示, x 0 1 3 4 y 2.2 4.3 4.8 6.7 从所得的散点图分析,y与x线性相关,且y=0.95x+a,则a= 2.6 . 解:因为回归直线方程必过样本点的中心(,), 由表中数据得=2,=4.5,将(2,4.5)代入y=0.95x+a,可得a=2.6. 7.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地
6、区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值. (2)你认为用哪个模型得到的预测值更可靠?并说明理由. (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元). 利用模型②,可得该地区2018年的环境基础设施投资
7、额的预测值为=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础
8、设施投资额的变化趋势,因此利用模型②得到的预测值更可靠. (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分) 8.一车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集的数据如下表: 零件数x(个) 10 20 30 40 加工时间y(min) 62 68 75 81 零件数x(个) 50 60 70 80 加工时间y(
9、min) 89 95 102 108 设回归方程为y =bx+a,则点(a,b)在直线x+45y-10=0的(C) A.左上方 B.左下方 C.右上方 D.右下方 解:由=45,=85,得a+45b=85,即有a+45b-10>0,故点(a,b)在直线x+45y-10=0的右上方,故选C. 9.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过这种血清的人与另外500名未使用这种血清的人一年中的感冒记录比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2=3.918,经查临界值表知P(K2≥3.841)≈0.05.由下列结论中,正确
10、结论的序号是 ① . ①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%. 解:因为K2=3.918≥3.841,而P(K2≥3.841)≈0.05, 所以有95%的把握认为“这种血清能起到预防感冒的作用”. 10.(2018·佛山一模)有甲、乙两家公司都愿意聘用某求职者,这两家公式的具体聘用信息如下: 甲公司 : 职位 A B C D 月薪/元 6000 7000 8000 9000 获得相应职位概率 0.4
11、 0.3 0.2 0.1 乙公司: 职位 A B C D 月薪/元 5000 7000 9000 11000 获得相应职位概率 0.4 0.3 0.2 0.1 (1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由; (2)某课外实习作业小组调查了1000名职场人士,就选择这两家公司的意愿作了统计,得到如下数据分布: 人员结构 选择意愿 40岁以上 (含40岁) 男性 40岁以上 (含40岁) 女性 40岁以下 男性 40岁以下 女性 选择甲公司 110 120 140 80 选
12、择乙公司 150 90 200 110 若分析选择意愿与年龄这两个分类变量,计算得到的K2的观测值为k1=5.5513,测得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学知识分析,选择意愿与年龄变量和性别变量哪一个关联性更大? 附:K2= P(K2≥k) 0.050 0.025 0.010 0.005 k 3.841 5.024 6.635 7.879 (1)设甲公司与乙公司的月薪分别为随机变量X,Y, 则E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000, E(Y)=5000×0.4+700
13、0×0.3+9000×0.2+11000×0.1=7000, D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002, D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002, 则E(X)=E(Y),D(X)<D(Y), 我希望不同职位的月薪差距小一些,故选择甲公司; 或我希望不同职位的月薪差距大一些,故选择乙公司. (2)因为k1=5.5513>5.024,根据表中对应值, 得出“选择意愿与年龄有关系”的结论犯错的概率的上限是0.025, 由数据分布可得选择意愿与性别两个分类变量的2×2列联表如下: 选择甲公司 选择乙公司 总计 男 250 350 600 女 200 200 400 总计 450 550 1000 计算K2==≈6.734, 且K2=6.734>6.635, 对照临界值表得出结论“选择意愿与性别有关”的犯错误的概率上限为0.01,由0.01<0.025,所以与年龄相比,选择意愿与性别关联性更大. 7
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。