广西2020版高考数学一轮复习 考点规范练52 变量间的相关关系、统计案例 文.docx
《广西2020版高考数学一轮复习 考点规范练52 变量间的相关关系、统计案例 文.docx》由会员分享,可在线阅读,更多相关《广西2020版高考数学一轮复习 考点规范练52 变量间的相关关系、统计案例 文.docx(10页珍藏版)》请在装配图网上搜索。
考点规范练52 变量间的相关关系、统计案例 一、基础巩固 1.根据如下样本数据: x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到的回归方程为y^=b^x+a^,则( ) A.a^>0,b^>0 B.a^>0,b^<0 C.a^<0,b^>0 D.a^<0,b^<0 答案B 解析由表中数据画出散点图,如图, 由散点图可知b^<0,a^>0,故选B. 2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( ) A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病 B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病 C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确 答案C 解析独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计. 3.两个随机变量x,y的取值如下表: x 0 1 3 4 y 2.2 4.3 4.8 6.7 若x,y具有线性相关关系,且y^=b^x+2.6,则下列四个结论错误的是( ) A.x与y是正相关 B.当x=6时,y的估计值为8.3 C.x每增加一个单位,y大约增加0.95个单位 D.样本点(3,4.8)的残差为0.56 答案D 解析由表格中的数据可知选项A正确; ∵x=14(0+1+3+4)=2,y=14(2.2+4.3+4.8+6.7)=4.5,∴4.5=2b^+2.6, 即b^=0.95,∴y^=0.95x+2.6. 当x=6时,y^=0.956+2.6=8.3,故选项B正确; 由y^=0.95x^+2.6可知选项C正确; 当x=3时,y^=0.953+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误. 4.“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表: 做不到“光盘” 能做到“光盘” 男 45 10 女 30 15 则下面的正确结论是( ) A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关” B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关” C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关” D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关” 答案A 解析由22列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=100(675-300)255457525≈3.030. 因为2.706<3.030,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A. 5.若两个分类变量X和Y的22列联表如下: y1 y2 合计 x1 5 15 20 x2 40 10 50 合计 45 25 70 则在犯错误的概率不超过 的前提下认为X与Y之间有关系. 答案0.001 解析K2的观测值k=70(510-4015)245252050≈18.822>10.828,所以在犯错误的概率不超过0.001的前提下认为X与Y之间有关系. 6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程y^=0.67x+54.9,现发现表中有一个数据看不清,请你推断出该数据的值为 . 零件数x/个 10 20 30 40 50 加工时间y/min 62 75 81 89 答案68 解析由题意,得x=30,y=307+a5,代入回归直线方程 y^=0.67x+54.9, 得307+a5=0.6730+54.9,解得a=68. 7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得∑i=110xi=80,∑i=110yi=20,∑i=110xiyi=184,∑i=110xi2=720. (1)求家庭的月储蓄y^对月收入x的线性回归方程y^=b^x+a^; (2)判断变量x与y之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解(1)由题意知n=10,x=110∑i=110xi=8010=8,y=110∑i=110yi=2010=2, 又∑i=110xi2-10x2=720-1082=80, ∑i=110xiyi-10xy=184-1082=24, 由此得b^=2480=0.3,a^=y-b^x=2-0.38=-0.4, 故所求线性回归方程为y^=0.3x-0.4. (2)由于变量y的值随x值的增加而增加(b^=0.3>0),因此x与y之间是正相关. (3)将x=7代入回归方程可以预测该家庭的月储蓄为y^=0.37-0.4=1.7(千元). 二、能力提升 8.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是( ) A.根据样本数据估计,该地区青少年身高与年龄成正相关 B.所抽取数据中,5 000名青少年平均身高约为145 cm C.直线l的斜率的值近似等于样本中青少年平均身高每年的增量 D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上 答案D 解析在给定范围内,随着年龄的增加,年龄越大,身高越高,该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均身高约是145cm,故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误,故选D. 9.已知x与y之间的几组数据如下表: x 1 2 3 4 5 6 y 0 2 1 3 3 4 假设根据上表数据所得线性回归直线方程y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是( ) A.b^>b,a^>a B.b^>b,a^a D.b^a,故选C. 10.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下的列联表: 优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计 已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是 .(填序号) ①列联表中c的值为30,b的值为35 ②列联表中c的值为15,b的值为50 ③根据列联表中的数据,若在犯错误的概率不超过 0.025的前提下,能认为“成绩与班级有关系” ④根据列联表中的数据,若在犯错误的概率不超过 0.025的前提下,不能认为“成绩与班级有关系” 答案③ 解析由题意知,成绩优秀的学生人数是30,成绩非优秀的学生人数是75,所以c=20,b=45,①②错误. 根据列联表中的数据,得到K2=105(1030-2045)255503075≈6.6>5.024, 因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”.故③正确,④错误. 三、高考预测 11.国内某知名大学有男生14 000人,女生10 000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表.(平均每天运动的时间单位:h,该校学生平均每天运动的时间范围是[0,3]) 男生平均每天运动的时间分布情况: 平均每天 运动的时间 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3] 人 数 2 12 23 18 10 x 女生平均每天运动的时间分布情况: 平均每天 运动的时间 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3] 人 数 5 12 18 10 3 y (1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1); (2)若规定平均每天运动的时间不少于2 h的学生为“运动达人”,低于2 h的学生为“非运动达人”. ①请根据样本估算该校“运动达人”的数量; ②请根据上述表格中的统计数据填写下面22列联表,并通过计算判断能否在犯错误的概率不超过 0.05的前提下认为“运动达人”与性别有关? 运动达人 非运动达人 总计 男生 女生 总计 参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 参考数据: P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.706 3.841 5.024 6.635 7.879 10.828 解(1)由分层抽样可知,抽取的男生人数为1201400014000+10000=70,抽取的女生人数为120-70=50,故x=5,y=2. 则该校男生平均每天运动的时间为 0.252+0.7512+1.2523+1.7518+2.2510+2.75570 ≈1.5(h), 故该校男生平均每天运动的时间约为1.5h. (2)①样本中“运动达人”所占比例是20120=16,故估计该校“运动达人”有16(14000+10000)=4000(人). ②由表格可知: 运动达人 非运动达人 总计 男生 15 55 70 女生 5 45 50 总计 20 100 120 故K2的观测值k=120(1545-555)2201005070 =9635≈2.743<3.841. 故在犯错误的概率不超过0.05的前提下不能认为“运动达人”与性别有关.- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广西2020版高考数学一轮复习 考点规范练52 变量间的相关关系、统计案例 广西 2020 高考 数学 一轮 复习 考点 规范 52 变量 相关 关系 统计 案例

链接地址:https://www.zhuangpeitu.com/p-3912073.html