2019-2020学年高中数学 第1章 统计案例章末复习课学案 新人教B版选修1-2



《2019-2020学年高中数学 第1章 统计案例章末复习课学案 新人教B版选修1-2》由会员分享,可在线阅读,更多相关《2019-2020学年高中数学 第1章 统计案例章末复习课学案 新人教B版选修1-2(11页珍藏版)》请在装配图网上搜索。
1、第1章 统计案例 回归分析问题 建立回归模型的步骤: (1)确定研究对象,明确变量x,y. (2)画出变量的散点图,观察它们之间的关系(如是否存在线性相关关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性相关关系,则选用回归直线方程=bx+a). (4)按一定规则估计回归方程中的参数(如最小二乘法). (5)得出回归方程. 另外,回归直线方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归直线方程的适用范围,否则没有实用价值. 【例1】 假设一个人从出生到死亡,在每个生日那天都测量身高,并作出这些数据散点图
2、,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录: 年龄/周岁 3 4 5 6 7 8 9 身高/cm 90.8 97.6 104.2 110.9 115.7 122.0 128.5 年龄/周岁 10 11 12 13 14 15 16 身高/cm 134.2 140.8 147.6 154.2 160.9 167.6 173.0 (1)作出这些数据的散点图; (2)求出这些数据的线性回归方程; (3)对于这个例子,你如何解释回归系数的含义? (4)解释
3、一下回归系数与每年平均增长的身高之间的联系. [思路探究] (1)作出散点图,确定两个变量是否线性相关; (2)求出,,写出线性回归方程; (3)回归系数即的值,是一个单位变化量; (4)根据线性回归方程可找出其规律. [解] (1)数据的散点图如下: (2)用y表示身高,x表示年龄, 因为=×(3+4+5+…+16)=9.5, =×(90.8+97.6+…+173.0)≈132, =≈≈6.316, =-b=71.998, 所以数据的线性回归方程为y=6.316x+71.998. (3)在该例中,回归系数6.316表示该人在一年中增加的高度. (4)回归系数与每
4、年平均增长的身高之间近似相等. 1.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下: x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9 43.1 49.2 (1)以x为解释变量,y为预报变量,作出散点图; (2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗. [解] (1)散点图如下. (2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系. 设回归方程为=bx+a,=30.36,=43.5, =5 101.56,=9 511.43.
5、 =1 320.66,2=1 892.25,2=921.729 6, iyi=6 746.76. 由=≈0.29, =-=43.5-0.29×30.36≈34.70. 故所求的线性回归方程为=34.70+0.29x. 当x=56.7时,=34.70+0.29×56.7=51.143. 估计成熟期有效穗约为51.143. 独立性检验 独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下,我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说
6、明假设不合理,根据随机变量χ2的含义,可以通过P(χ2>6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%. 独立性检验的一般步骤: (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算χ2的值. (3)比较χ2与临界值的大小关系并作统计推断. 【例2】 在某校高三年级一次全年级的大型考试中数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大? 物理 化学 总分 数学优秀 228 22
7、5 267 数学非优秀 143 156 99 注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人. [思路探究] 分别列出数学与物理,数学与化学,数学与总分优秀的2×2列联表,求k的值.由观测值分析,得出结论. [解] (1)列出数学与物理优秀的2×2列联表如下: 物理优秀 物理非优秀 合计 数学优秀 228 132 360 数学非优秀 143 737 880 合计 371 869 1 240 n11=228,n12=132,n21=143,n22=737, n1+=360,n2+=880,n+1=371,n+2=869,n=
8、1 240. 代入公式χ2= 得χ21=≈270.114 3. (2)列出数学与化学优秀的2×2列联表如下: 化学优秀 化学非优秀 合计 数学优秀 225 135 360 数学非优秀 156 724 880 合计 381 859 1 240 n11=225,n12=135,n21=156,n22=724, n1+=360,n2+=880,n+1=381,n+2=859,n=1 240. 代入公式,得χ22=≈240.611 2. (3)列出数学与总分优秀的2×2列联表如下: 总分优秀 总分非优秀 合计 数学优秀 267 93 3
9、60 数学非优秀 99 781 880 合计 366 874 1 240 n11=267,n12=93,n21=99,n22=781, n1+=360,n2+=880,n+1=366,n+2=874,n=1 240. 代入公式,得χ23=≈486.122 5. 由上面计算可知数学成绩优秀与物理、化学、总分优秀都有关系,由计算分别得到χ2的统计量都大于临界值6.635,由此说明有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,与物理次之. 2.某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经
10、调查发现,在不服用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A疾病是否有效. [解] 将问题中的数据写成如下2×2列联表: 患A疾病 不患A疾病 合计 服用该药品 5 100 105 不服用该药品 18 400 418 合计 23 500 523 将上述数据代入公式χ2=中,计算可得χ2≈0.041 4,因为0.041 4<3.841,故没有充分理由认为该保健药品对预防A疾病有效. 转化与化归思想在回归分析中的应用 回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量
11、非线性相关,我们可以通过对变量进行变换,转化为线性相关问题. 【例3】 某商店各个时期的商品流通率y(%)的商品零售额x(万元)资料如下: x 9.5 11.5 13.5 15.5 17.5 y 6 4.6 4 3.2 2.8 x 19.5 21.5 23.5 25.5 27.5 y 2.5 2.4 2.3 2.2 2.1 散点图显示出x与y的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元
12、的商品流通率. [解] 设u=,则y=a+bu,得下表数据: u 0.105 3 0.087 0 0.074 1 0.064 5 0.057 1 y 6 4.6 4 3.2 2.8 u 0.051 3 0.046 5 0.042 6 0.039 2 0.036 4 y 2.5 2.4 2.3 2.2 2.1 由表中数据可得y与u之间的回归直线方程为 =-0.187 5+56.25 u. 所以所求的回归方程为=-0.187 5+.当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%. 3.在某化
13、学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量. x/min 1 2 3 4 5 6 y/mg 39.8 32.2 25.4 20.3 16.2 13.3 (1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001); (2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1). [解] (1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln =b,则z=a+bx.由已知数据,得 x 1 2 3 4 5 6 y 39.8
14、 32.2 25.4 20.3 16.2 13.3 z 3.684 3.472 3.235 3.011 2.785 2.588 由公式得≈3.905 5,≈-0.221 9,则线性回归方程为=3.905 5-0.221 9x.而ln c≈3.905 5,ln d≈-0.221 9, 故c≈49.675,d≈0.801, 所以c,d的估计值分别为49.675,0.801. (2)当x=10时,由(1)所得公式可得y≈5.4(mg). 所以化学反应进行到10 min时未转化物质的质量约为5.4 mg. 1.为了解某社区居民的家庭年收入与年支出的关系,随机调查
15、了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程=bx+a,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 [解析] 由题意知,==10, ==8, ∴=8-0.76×10=0.4, ∴当x=15时,=0.76×15+0.4=11.8(万元). [答案] B 2.根据如下样本数据 x 3 4 5
16、6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到的回归方程为=bx+a,则( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 [解析] 作出散点图如下: 观察图象可知,回归直线=bx+a的斜率b<0,当x=0时,=a>0.故a>0,b<0. [答案] B 3.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…
17、,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. [解] (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下: (ⅰ)从折线图可以看出,
18、2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠. (ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①
19、得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,答出其中任意一种或其他合理理由均可) 4.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任
20、务所需时间超过m和不超过m的工人数填入下面的列联表: 超过m 不超过m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:χ2=. [解] (1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. (ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完
21、成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高. (ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第
22、二种生产方式的效率更高. (以上给出了4种理由,答出其中任意一种或其他合理理由均可) (2)由茎叶图知m==80. 列联表如下: 超过m 不超过m 第一种生产方式 15 5 第二种生产方式 5 15 (3)由于χ2==10>6.635,所以有99%的把握认为两种生产方式的效率有差异. 5.如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:
23、yi=9.32,tiyi=40.17,=0.55,≈2.646. 参考公式:相关系数r=,回归方程=a+bt中斜率和截距的最小二乘法估计公式分别为=,=-. [解] (1)由折线图中的数据和附注中的参考数据得 =4, (ti-)2=28,=0.55, (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89, ∴r≈≈0.99. 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系. (2)由=≈1.331及(1)得 ==≈0.103. =-≈1.331-0.103×4≈0.92. 所以y关于t的回归方程为=0.92+0.10t. 将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. - 11 -
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 36个关键词详解2025政府工作报告
- 学习2025年政府工作报告中的八大科技关键词
- 2025年政府工作报告要点速览接续奋斗共谱新篇
- 学习2025政府工作报告里的加减乘除
- 深化农村改革党课ppt课件(20250305)
- 弘扬雷锋精神凝聚奋进力量学习雷锋精神的丰富内涵和时代价值
- 深化农村改革推进乡村全面振兴心得体会范文(三篇)
- 2025年民营企业座谈会深度解读PPT课件
- 领导干部2024年述职述廉述责述学述法个人报告范文(四篇)
- 读懂2025中央一号党课ppt课件
- 2025年道路运输企业主要负责人安全考试练习题[含答案]
- 2024四川省雅安市中考英语真题[含答案]
- 2024湖南省中考英语真题[含答案]
- 2024宁夏中考英语真题[含答案]
- 2024四川省内江市中考英语真题[含答案]