《2019届高考数学总复习 模块六 概率与统计 第19讲 概率与统计学案 文.docx》由会员分享,可在线阅读,更多相关《2019届高考数学总复习 模块六 概率与统计 第19讲 概率与统计学案 文.docx(16页珍藏版)》请在装配图网上搜索。
第19讲 概率与统计
1.[2017全国卷Ⅰ] 为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得x=116∑i=116xi=9.97,s=116∑i=116(xi-x)2=116∑i=116xi2-16 x 2≈0.212,∑i=116(i-8.5)2≈18.439,∑i=116(xi-x)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检的零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,0.008≈0.09.
[试做]
命题角度 变量间的相关关系
(1)判断相关关系的两种方法:
方法一,散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系,如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.
方法二,相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.
(2)解决非线性回归问题的方法及步骤:
①确定变量:确定解释变量为x,预报变量为y;
②画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数,二次函数)的图像作比较,选取拟合效果好的函数模型;
③变量置换:通过变量置换把非线性回归问题转化为线性回归问题;
④分析拟合效果:通过计算相关指数等来判断拟合效果;
⑤写出非线性回归方程.
2.[2017全国卷Ⅱ] 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
图M6-19-1
(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:P(K2≥k)k 0.050 0.010 0.001 3.841 6.635 10.828 ,K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
[试做]
命题角度 独立性检验问题
独立性检验就是判断两个分类变量是否有关系,并能较为准确地给出这种判断的可信度.具体做法是根据公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.
解答1概率与样本估计总体的交汇问题
1 在贯彻中共中央国务院关于精准扶贫政策的过程中,某单位定点帮扶甲、乙两个村各50户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、劳动能力情况、子女受教育情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x和y,制成图M6-19-2,其中“”表示甲村贫困户,“+”表示乙村贫困户.若0
6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
考点考法探究
解答1
例1 解:(1)由图知,在乙村的50户贫困户中,指标x满足06.635,所以有99%的把握认为两种生产方式的效率有差异.
【自我检测】
解:(1)被抽查的该月骑车次数在[40,60)之间的老年人有6人,骑车次数在[40,50)之间的有4人,记为a,b,c,d,骑车次数在[50,60)之间的有2人,记为A,B.从6位老年人中任选两名幸运者的选法有(a,b),(a,c),(a,d),(a,A),(a,B),(b,c),(b,d),(b,A),(b,B),(c,d),(c,A),(c,B),(d,A),(d,B),(A,B),共15种,其中满足条件的选法有(a,A),(a,B),(b,A),(b,B),(c,A),(c,B),(d,A),(d,B),共8种,故所求概率P=815.
(2)(i)估计该市在32岁至44岁年龄段的一个青年人每月骑车的平均次数为125+2815+2025+14035+6045+1505512+28+20+140+60+150=16 830410≈41.
(ii)根据题意,得出如下22列联表:
骑行爱好者
非骑行爱好者
总计
青年人
700
100
800
非青年人
800
200
1000
总计
1500
300
1800
K2的观测值k=1800(700200-100800)280010001500300=18>10.828,
所以能在犯错误的概率不超过0.001的前提下认为“骑行爱好者”与“青年人”有关.
[备选理由] 备用例1是统计的综合交汇问题,是对信息题型的补充;备用例2是独立性检验与概率、统计的交汇问题.
例1 [配例2使用]2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月该品牌新能源汽车的实际销量,如下表:
月份
2017.12
2018.01
2018.02
2018.03
2018.04
月份编号
1
2
3
4
5
销量(万辆)
0.5
0.6
1
1.4
1.7
(1)经分析发现,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程=t+,并预测2018年5月份当地该品牌新能源汽车的销量;
(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到下表:
补贴金额预期值
(万元)
[1,2)
[2,3)
[3,4)
[4,5)
[5,6)
[6,7]
频数
20
60
60
30
20
10
(i)求这200位拟购买新能源汽车的消费者对补贴金额的心理预期值X的样本方差s2及中位数的估计值(同一区间的预期值可用该区间的中点值代表;估计值精确到0.1);
(ii)将对补贴金额的心理预期值在[1,2)(万元)和[6,7](万元)的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6人,再从这6人中随机抽取3人进行跟踪调查,求抽出的3人中至少有1名“欲望膨胀型”消费者的概率.
参考公式及数据:①回归方程=t+,其中=∑i=1ntiyi-nty∑i=1nti2-nt2,=y-t;②∑i=15tiyi=18.8.
解:(1)易知t=1+2+3+4+55=3,y=0.5+0.6+1+1.4+1.75=1.04,∑i=15ti2=12+22+32+42+52=55,=∑i=15tiyi-5ty∑i=15ti2-5t2=18.8-531.0455-532=0.32,
=y-t=1.04-0.323=0.08,
则y关于t的线性回归方程为=0.32t+0.08,
当t=6时,=2.00,即2018年5月份当地该品牌新能源汽车的销量约为2万辆.
(2)(i)根据题意,这200位拟购买新能源汽车的消费者对补贴金额的心理预期值X的平均值为1.50.1+2.50.3+3.50.3+4.50.15+5.50.1+6.50.05=3.5,
s2=(1.5-3.5)20.1+(2.5-3.5)20.3+(3.5-3.5)20.3+(4.5-3.5)20.15+(5.5-3.5)20.1+
(6.5-3.5)20.05=1.7,
中位数的估计值为3+1100-20-6060=3+13≈3.3.
(ii)设从“欲望膨胀型”消费者中抽取m人,从“欲望紧缩型”消费者中抽取n人,由分层抽样的定义可知630=m10=n20,解得m=2,n=4.
在抽取的6人中,2名“欲望膨胀型”消费者分别记为A1,A2,4名“欲望紧缩型”消费者分别记为B1,B2,B3,B4,从中抽取3人,则所有的抽样情况如下:
{A1,A2,B1},{A1,A2,B2},{A1,A2,B3},{A1,A2,B4},{A1,B1,B2},{A1,B1,B3},{A1,B1,B4},{A1,B2,B3},{A1,B2,B4},{A1,B3,B4},{A2,B1,B2},{A2,B1,B3},{A2,B1,B4},{A2,B2,B3},{A2,B2,B4},{A2,B3,B4},{B1,B2,B3},{B1,B2,B4},{B1,B3,B4},{B2,B3,B4},共20种.
其中至少有1名“欲望膨胀型”消费者的情况有16种,
记事件A为“抽出的3人中至少有1名‘欲望膨胀型’消费者”,则P(A)=1620=0.8.
例2 [配例3使用] 高中生在被问及“家、朋友聚集的地方、个人空间这三个场所中感到最幸福的场所是哪里”这个问题时,不同的人有不同的答案.某机构从洛阳的高中生中随机抽取了55人,从上海的高中生中随机抽取了45人,询问该问题.洛阳的高中生中选择家的占25,选择朋友聚集的地方的占310,选择个人空间的占310.上海的高中生中选择家的占15,选择朋友聚集的地方的占35,选择个人空间的占15.记在家中感到最幸福为恋家,在其他场所感到最幸福为不恋家.
(1)请根据以上调查结果将下面22列联表补充完整,并判断能否有95%的把握认为是否恋家与城市有关;
恋家
不恋家
总计
洛阳高中生
上海高中生
总计
(2) 从被调查的不恋家的上海学生中,用分层抽样的方法选出4人接受进一步调查,从被选出的4 人中随机抽取2人到洛阳交流学习,求这2人中含有在个人空间感到最幸福的学生的概率.
附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
P(K2≥k0)
0.050
0.025
0.010
0.001
k0
3.841
5.024
6.635
10.828
解:(1)由已知得列联表如下:
恋家
不恋家
总计
洛阳高中生
22
33
55
上海高中生
9
36
45
总计
31
69
100
∴K2=100(2236-933)231695545≈4.628>3.841,∴有95%的把握认为是否恋家与城市有关.
(2)在被调查的不恋家的上海学生中,用分层抽样的方法选出4 人,其中在朋友聚集的地方感到最幸福的有3人,分别设为a1,a2,a3;在个人空间感到最幸福的有1人,设为b.
从被选出的4人中随机抽取2人,所有可能的情况为(a1,a2),(a1,a3),(a1,b),(a2,a3),(a2,b),(a3,b),共6种.
其中含有在个人空间感到最幸福的学生的情况为(a1,b),(a2,b),(a3,b),共3种,
则所求的概率为P(A)=36=12.
链接地址:https://www.zhuangpeitu.com/p-6288399.html