2019-2020年高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文.doc
《2019-2020年高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文.doc》由会员分享,可在线阅读,更多相关《2019-2020年高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文.doc(59页珍藏版)》请在装配图网上搜索。
2019-2020年高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文 1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法. 三种抽样方法 类别 共同点 各自特点 相互联系 适用范围 简单随 机抽样 抽样过程中每个个体被抽取的概率相等,均属于不放回抽样 从总体中逐个抽取 总体中的个体数较少 系统 抽样 将总体均分成几部分,按事先确定的规则在各部分中抽取 在起始部分抽样时采用简单随机抽样 总体中的个体数较多 分层 抽样 将总体分成几层,分层进行抽样 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成 两种抽样的步骤 (1)系统抽样的步骤 ①先将总体的N个个体编号; ②确定分段间隔k(k∈N*),对编号进行分段.当(n是样本容量)是整数时,取k=; ③在第1段用简单随机抽样确定第1个个体编号l(l≤k); ④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. (2)分层抽样的步骤 ①分层:按某种特征将总体分成若干部分; ②按比例确定每层抽取个体的个数; ③各层分别按简单随机抽样或系统抽样的方法抽取个体; ④综合每层抽样,组成样本. 1.判断下面结论是否正确(请在括号中打“√”或“”) (1)分层抽样就是按比例抽样.( ) (2)简单随机抽样是一种不放回抽样.( ) (3)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ) (4)系统抽样在起始部分抽样时采用简单随机抽样.( ) (5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ) 答案: (1)√ (2)√ (3) (4)√ (5) 2.(xx江西卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07 C.02 D.01 解析: 由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01. 答案: D 3.(xx广东卷)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 解析: 由=25,可得分段的间隔为25.故选C. 答案: C 4.(xx湖北卷)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 解析: 设乙设备生产的产品总数为x件,则甲设备生产的产品总数为(4 800-x)件.由分层抽样特点,结合题意可得=,解得x=1 800. 答案: 1 800 5.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________. 解析: 在系统抽样中,确定分段间隔k,对编号进行分段, k=(N为总体的容量,n为样本的容量), ∴k===40. 答案: 40 简单随机抽样 1.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( ) A. B. C. D. 解析: 由题意知=,∴n=28.∴P==. 答案: B 2.下列抽取样本的方式是简单随机抽样的有________个. ①从无限多个个体中抽取50个个体作为样本; ②箱子里有100支铅笔,今从中选取10支进行检验.在抽样操作时,从中任意拿出一支检测后再放回箱子里; ③从50个个体中一次性抽取5个个体作为样本. 解析: ①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点. 答案: 0 解决简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法. (2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. 系统抽样 1.(xx湖南卷)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样的三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2<p3 B.p2=p3<p1 C.p1=p3<p2 D.p1=p2=p3 解析: 根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样,每个个体被抽到的概率都是p=,故p1=p2=p3,故选D. 答案: D 2.(xx陕西卷)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 解析: 抽样间隔为=20.设在1,2,…,20中抽取号码x0(x0∈[1,20]),在[481,720]之间抽取的号码记为20k+x0,则481≤20k+x0≤720,k∈N*. ∴24≤k+≤36. ∵∈,∴k=24,25,26,…,35, ∴k值共有35-24+1=12(个),即所求人数为12. 答案: B 解决系统抽样应注意的问题 (1)适合元素个数较多且均衡的总体; (2)各个个体被抽到的机会均等; (3)样本的第一个个体用简单随机抽样. 分层抽样 1.(xx重庆卷)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( ) A.100 B.150 C.200 D.250 解析: 法一:由题意可得=,解得n=100,故选A. 法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000=100. 答案: A 2.某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表: 高一年级 高二年级 高三年级 跑步 a b c 登山 x y z 其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取( ) A.36人 B.60人 C.24人 D.30人 解析: 根据题意可知样本中参与跑步的人数为200=120,所以从高二年级参与跑步的学生中应抽取的人数为120=36. 答案: A 分层抽样问题的解题策略 (1)确定抽样比.可依据各层总数与样本数之比,确定抽样比. (2)求某一层的样本数或总体个数.可依题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数. (3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. A级 基础训练 1.(xx大连市第一次模拟)某学校礼堂有30排座位,每排有20个座位,一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的30名学生.这里运用的抽样方法是( ) A.抽签法 B.随机数表法 C.系统抽样 D.分层抽样 解析: 抽30名学生分了30组(每排为一组),每组抽一个,符合系统抽样的定义,故选C. 答案: C 2.某班级有男生20人,女生30人,从中抽取10人作为样本,恰好抽到了4个男生、6个女生,则下列命题正确的是( ) A.该抽样可能是简单随机抽样 B.该抽样一定不是系统抽样 C.该抽样中女生被抽到的概率大于男生被抽到的概率 D.该抽样中女生被抽到的概率小于男生被抽到的概率 解析: 本题看似是一道分层抽样的题,实际上每种抽样方法都可能出现这个结果,故B不正确.根据抽样的等概率性知C,D不正确. 答案: A 3.800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机抽到一个数,如果抽到的是7,则从33~48这16个数中应取的数是( ) A.40 B.39 C.38 D.37 解析: 按系统抽样分组,33~48这16个数属第3组,则这一组应抽到的数是7+216=39. 答案: B 4.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( ) A.101 B.808 C.1 212 D.2 012 解析: 由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有=,解得N=808. 答案: B 5.(xx上海松江期末考试)某市共有400所学校,现要用系统抽样的方法抽取20所学校作为样本,调查学生课外阅读的情况.把这400所学校编上1~400的号码,再从1~20中随机抽取一个号码,如果此时抽得的号码是6,则在编号为21到40的学校中,应抽取的学校的编号为( ) A.25 B.26 C.27 D.以上都不是 解析: 系统抽样是把个体编号后,先抽取第一个,然后每次间隔相同的数依次抽取,本题中每次间隔20,第一个抽取的是6号,接下来应该抽取的是26号,故选B. 答案: B 6.(xx天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 解析: 由分层抽样的特点可得应该从一年级本科生中抽取300=60(名)学生. 答案: 60 7.(xx江苏南通二调)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________. 解析: 根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76. 答案: 76 8.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为n的样本,进行成绩分析,若从B校学生中抽取40人,则n=________. 解析: 设A、B、C三所学校学生人数分别为x、y、z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为500=40,得n=120. 答案: 120 9.某初级中学共有学生2 000名,各年级男、女生人数如下表: 初一年级 初二年级 初三年级 女生 373 x y 男生 377 370 z 已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x的值; (2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? 解析: (1)∵=0.19,∴x=380. (2)初三年级人数为y+z=2 000-(373+377+380+370)=500, 现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:500=12名. 10.一次数学模拟考试,共12道选择题,每题5分,共计60分,每道题有四个可供选择的答案,仅有一个是正确的.学生小张只能确定其中10道题的正确答案,其余2道题完全靠猜测回答. 小张所在班级共有40人,此次考试选择题得分情况统计表如下: 得分(分) 40 45 50 55 60 百分率 15% 10% 25% 40% 10% 现采用分层抽样的方法从此班级抽取20人的试卷进行选择题质量分析. (1)应抽取多少张选择题得60分的试卷? (2)若小张选择题得60分,求他的试卷被抽到的概率. 解析: (1)得60分的人数为4010%=4. 设抽取x张选择题得60分的试卷,则=, 则x=2,故应抽取2张选择题得60分的试卷. (2)设小张的试卷为a1,另三名得60分的同学的试卷为a2,a3,a4,所有抽取60分试卷的方法为:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共6种,其中小张的试卷被抽到的抽法共有3种,故小张的试卷被抽到的概率为P==. B级 能力提升 1.在某大学数学专业的160名学生中开展一项社会调查,先将学生随机编号为01,02,03,…,160,采用系统抽样的方法抽取样本,已知抽取的学生中最小的两个编号为07,23,那么抽取的学生中最大编号应该是( ) A.150 B.151 C.142 D.143 解析: 由最小的两个编号为07,23可知,抽样间距为16,因此抽取人数的比例为,即抽取10名学生,其编号构成首项为7,公差为16的等差数列,故抽取的学生中最大编号为7+916=151. 答案: B 2.一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,7,要用(错位)系统抽样的方法抽取一个容量为8的样本.即规定先在第0组随机抽取一个号码,记为i,依次错位地得到后面各组的号码,即第k组中抽取个位数字为i+k(当i+k<10)或i+k-10(当i+k≥10)的号码.在i=6时,所抽到的8个号码是________. 解析: 由题意得,在第1组抽取的号码的个位数字是6+1=7,故应选17;在第2组抽取的号码的个位数字是6+2=8,故应选28,此次类推,应选39,40,51,62,73. 答案: 6,17,28,39,40,51,62,73 3.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表: 学历 35岁以下 35~50岁 50岁以上 本科 80 30 20 研究生 x 20 y (1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率; (2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值. 解析: (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,∴=,解得m=3. 抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3. 从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3), 其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2). ∴从中任取2人,至少有1人学历为研究生的概率为. (2)由题意,得=,解得N=78. ∴35~50岁中被抽取的人数为78-48-10=20, ∴==,解得x=40,y=5. 即x,y的值分别为40,5. 4.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n. 解析: 总体容量为6+12+18=36. 当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为6=,技术员人数为12=,技工人数为18=,所以n应是6的倍数,36的约数,即n=6,12,18.由条件增加1人时知,只有n=6符合. 第二节 用样本估计总体 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 1.统计图表的含义 (1)频率分布表 ①含义:把反映总体频率分布的表格称为频率分布表. ②频率分布表的画法步骤: 第一步:求极差,决定组数和组距,组距=; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:能够反映样本的频率分布规律的直方图. (3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图. (4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线. (5)茎叶图的画法步骤 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数. (3)平均数:把称为a1,a2,…,an这n个数的平均数. (4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是 s= s2=[(x1-)2+(x2-)2+…+(xn-)2] 1.标准差和方差的异同 相同点:标准差和方差描述了一组数据围绕平均数波动的大小. 不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然. 2.众数、中位数和平均数的异同 众数 中位数 平均数 相同点 都是描述一组数据集中趋势的量 不同点 与这组数据中的部分数据有关,出现在这些数据中 不一定在这些数据中出现.奇数个时,在这组数值中出现;偶数时,为中间两数平均值 不一定在这些数值中出现 1.判断下面结论是否正确(请在括号中打“√”或“”) (1)在频率分布直方图中,小矩形的高表示频率.( ) (2)频率分布直方图中各个长方形的面积之和为1.( ) (3)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ) (4)茎叶图只适用数据为两位数字.( ) (5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) 答案: (1) (2)√ (3) (4) (5)√ 2.从一堆苹果中任取10只,称得它们的质量如下(单位:克): 125 120 122 105 130 114 116 95 120 134 则样本数据落在[114.5,124.5)内的频率为( ) A.0.2 B.0.3 C.0.4 D.0.5 解析: 落在[114.5,124.5)内的样本数据为120,122,116,120,共4个,故所求频率为==0.4. 答案: C 3.(xx广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A.200,20 B.100,20 C.200,10 D.100,10 解析: 该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 0002%=200,其中抽取的高中生近视人数为2 0002%50%=20,故选A. 答案: A 4.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高. 解析: 结合茎叶图中成绩的情况可知,乙班平均成绩较高. 答案: 乙 5.某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________; (2)命中环数的标准差为________. 解析: (1)==7. (2)s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2. 答案: (1)7 (2)2 样本的数字特征 1.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有( ) A.a>b>c B.b>c>a C.c>a>b D.c>b>a 解析: 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b==15,众数c=17,则a<b<c. 答案: D 2.一个样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是( ) A.3 B.4 C.5 D.6 解析: 由x2-5x+4=0两根分别为1,4, ∴有或. 又a,3,5,7的平均数是b. 即=b,=b,a+15=4b, ∴符合题意,则方差s2=5,故选C. 答案: C 3.(xx陕西卷)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.,s2+1002 B.+100,s2+1002 C.,s2 D.+100,s2 解析: 法一:对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D. 法二:由题意知x1+x2+…xn=n ,s2=[(x1-)2+(x2-)2+…+(xn-)2], 则所求均值=[(x1+100)+(x2+100)+…+(xn+100)]=(n +n100)=+100, 而所求方差t2=[(x1+100-)2+(x2+100-)2+…+(xn+100-)2]=[(x1-)2+(x2-)2+…+(xn-)2]=s2,故选D. 答案: D 众数、中位数、平均数及方差的意义及计算方法 (1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)平均数、方差的公式推广 ①若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m +a. ②数据x1,x2,…,xn的方差为s2. (ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2; (ⅱ)数据ax1,ax2,…,axn的方差为a2s2. (3)方差的简化计算公式 s2=[(x+x+…+x)-n 2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方. 茎叶图 (xx新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 解析: (1)设A药观测数据的平均数为,B药观测数据的平均数为. 由观测结果可得 =(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, =(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得>,因此可看出A药的疗效更好. (2)由观测结果可绘制茎叶图如图: 从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好. 1.如图是根据《山东统计年鉴xx》中的资料做成的xx年至xx我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到xx年至xx我省城镇居民百户家庭人口的平均数为( ) A.304.6 B.303.6 C.302.6 D.301.6 解析: 由茎叶图可知,这一组数据的平均数 ==303.6. 答案: B 2.(xx安徽省“江南十校”联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( ) A.8 B.5 C.4 D.2 解析: 甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87、89,故它们之差的绝对值是2. 答案: D 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. 频率分布直方图 (xx新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8 (1)在下表作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定? 解析: (1)如图所示: (2)质量指标值的样本平均数为 =800.06+900.26+1000.38+1100.22+1200.08=100. 质量指标值的样本方差为: s2=(-20)20.06+(-10)20.26+020.38+1020.22+2020.08=104. 所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104. (3)质量指标值不低于95的产品所占比例的估计值为 0.38+0.22+0.08=0.68. 由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定. 1.(xx广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如下: (1)确定样本频率分布表中n1,n2,f1和f2的值; (2)根据上述频率分布表,画出样本频率分布直方图; (3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率. 解析: (1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2, 所以f1===0.28,f2===0.08. (2)样本频率分布直方图如图. (3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4. 2.(xx重庆卷)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下: (1)求频率分布直方图中a的值; (2)分别求出成绩落在[50,60)与[60,70)中的学生人数; (3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率. 解析: (1)据直方图知组距=10, 由(2a+3a+6a+7a+2a)10=1, 解得a==0.005. (2)成绩落在[50,60)中的学生人数为20.0051020=2,成绩落在[60,70)中的学生人数为30.0051020=3. (3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个: (A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3), 其中2人的成绩都在[60,70)中的基本事件有3个: (B1,B2),(B1,B3),(B2,B3),故所求概率为P=. 3.(xx黑龙江大庆一中第二次阶段考试)某班同学利用寒假在5个居民小区内选择两个小区逐户进行一次“低碳生活习惯”的调查,以计算每户的碳月排放量.若月排放量符合低碳标准的称为“低碳族”,否则称为“非低碳族”.若小区内有至少75%的住户属于“低碳族”,则称这个小区为“低碳小区”,否则称为“非低碳小区”.已知备选的5个居民小区中有三个非低碳小区,两个低碳小区. (1)求所选的两个小区恰有一个为“非低碳小区”的概率; (2)假定选择的“非低碳小区”为小区A,调查显示其“低碳族”的比例为,数据如图1所示,经过同学们的大力宣传,三个月后,又进行了一次调查,数据如图2所示,问这时小区A是否达到“低碳小区”的标准? 解析: (1)设三个“非低碳小区”为B,C,D,两个“低碳小区”为m,n,则从5个小区中任选两个小区,所有可能的结果有10种,它们是(B,C),(B,D),(B,m),(B,n),(C,D),(C,m),(C,n),(D,m),(D,n),(m,n),恰有一个为“非低碳小区”的结果有(B,m),(B,n),(C,m),(C,n),(D,m),(D,n),共6种,故所求概率为P==. (2)由题图1可知月碳排放量不超过300千克的称为“低碳族”. 由题图2可知,三个月后的“低碳族”的比例为0.07+0.23+0.46=0.76>0.75,所以三个月后小区A达到了“低碳小区”的标准. 解决频率分布直方图问题时要抓住: (1)直方图中各小长方形的面积之和为1. (2)直方图中纵轴表示,故每组样本的频率为组距,即矩形的面积. (3)直方图中每组样本的频数为频率总体数. A级 基础训练 1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A.0.05 B.0.25 C.0.5 D.0.7 解析: 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7. 答案: D 2.(xx山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A.6 B.8 C.12 D.18 解析: 由题图可知,第一组和第二组的频率之和为(0.24+0.16)1=0.40,故该试验共选取的志愿者有=50人.所以第三组共有500.36=18人,其中有疗效的人数为18-6=12. 答案: C 3.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图,如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于( ) A.80 B.90 C.100 D.110 解析: 设第1个小长方形的面积为S, 则4个小长方形的面积之和为, 由题意知,4S+40.1=1, 故S=0.1,又因为=0.1,所以n=100. 答案: C 4.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( ) A.13,12 B.13,13 C.12,13 D.13,14 解析: 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=(a3)2=64,(8-2d)(8+4d)=64,(4-d)(2+d)=8,2d-d2=0,又d≠0,故d=2,故样本数据为:4、6、8、10、12、14、16、18、20、22,平均数为==13,中位数为=13. 答案: B 5.甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,1、2分别表示甲、乙两名运动员这项测试成绩的平均数,s1、s2分别表示甲、乙两名运动员这项测试成绩的标准差,则有( ) A.1>2,s1<s2 B.1=2,s1=s2 C.1=2,s1<s2 D.1=2,s1>s2 解析: 1=15,2=15,s=,s=. 答案: C 6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________、________. 解析: 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46. 答案: 45 46 7.(xx江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm. 解析: 由频率分布直方图可得树木底部周长小于100 cm的频率是(0.025+0.015)10=0.4,又样本容量是60,所以频数是0.460=24. 答案: 24 8.(xx湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x的值为________; (2)在这些用户中,用电量落在区间[100,250)内的户数为________. 解析: (1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)50=1,解得x=0.004 4; (2)(0.003 6+0.006 0+0.004 4)50100=70. 答案: (1)0.004 4 (2)70 9.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一些. 解析: (1)甲=(8+6+7+8+6+5+9+10+4+7)=7, 乙=(6+7+7+8+6+7+8+7+9+5)=7. (2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2]可求得s=3.0,s=1.2. (3)由甲=乙,说明甲、乙两战士的平均水平相当; 又∵s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定. 10.(xx北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9 [16,18) 2 合计 100 (1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a,b的值; (3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论) 解析: (1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1-=0.9. 从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)的有17人,频率为0.17,所以a===0.085. 课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b===0.125. (3)样本中的100名学生课外阅读时间的平均数在第4组. B级 能力提升 1.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是( ) A.平均数 B.标准差 C.众数 D.中位数 解析: A样本数据的平均数=,B样本数据的平均数′=-5.A样本数据的方差s2=[(42-)2+(43-)2+…+(50-)2],B样本数据的方差s′2=[(42-)2+(43-)2+…+(50-)2],∴A、B两样本的标准差相同,故选B. 答案: B 2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________. 解析: 根据茎叶图,去掉1个最低分87,1个最高分99, 则[87+94+90+91+90+(90+x)+91]=91, ∴x=4. ∴s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=. 答案: 3.(xx通化模拟)某学科在市模考后从全年级抽出100名学生的学科成绩作为样本进行分析,得到样本频率分布直方图如图所示. (1)利用组中值估计该次考试该学科的平均成绩. (2)估计该学科成绩在[100,130)之间的概率. (3)为详细了解每题的答题情况,从样本中成绩在80~100之间的试卷中任选2份进行分析,求至少有1人成绩在80~90之间的概率. 解析: (1)用每组的组中值作为该组的平均值,算得该次考试该学科的平均成绩为124.4分. (2)样本中学生成绩在[100,130)之间的频率为0.58,故由频率估计该学科成绩在[100,130)之间的概率P1=0.58. (3)样本中成绩在80~90之间有2人,设其编号为①②;样本中成绩在90~100之间有4人,设其编号为③④⑤⑥.从上述6人中任取2人的所有选取可能为:①②,①③,①④,①⑤,①⑥,②③,②④,②⑤,②⑥,③④,③⑤,③⑥,④⑤,④⑥,⑤⑥. 故从样本中成绩在80~100之间任选2人所有可能结果数为15, 至少有1人成绩在80~90之间可能结果数为9,因此,所求概率为P2=0.6. 4.(xx唐山调研)在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示: (1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由; (2)从乙的6次成绩中随机选择2个成绩,试求选到123分的概率. 解析: (1)甲==112, 乙==112, s=[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-112)2+(124-112)2]=, s=[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-112)2+(123-112)2]=, ∴甲=乙,s>s, 说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,则选择乙同学. (2)从6个成绩中随机选择2个,共有15个基本事件,分别是: {102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113},{105,117},{105,123},{112,113},{112,117},{112,123},{113,117},{113,123},{117,123},其中满足条件的基本事件有5个,故所求概率P==. 第三节 变量间的相关关系、统计案例 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用. 1.相关关系与回归方程 (1)相关关系的分类: ①正相关:从散点图上看,点散布在从左下角到右上角的区域内; ②负相关:从散点图上看,点散布在从左上角到右下角的区域内. (2)线性相关关系: 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. (3)回归方程: ①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法. ②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则==, =-,其中,是回归方程的斜率,是在y轴上的截距. (4)样本相关系数: r=,用它来衡量两个变量间的线性相关关系. ①当r>0时,表明两个变量正相关; ②当r<0时,表明两个变量负相关. ③r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于0.75时,认为两个变量有很强的线性相关性. 2.独立性检验 (1)22列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称22列联表)为: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d (2)K2统计量: K2=.(其中n=a+b+c+d为样本容量) 1.线性回归直线方程的求法 求解回归方程关键是确定回归系数,,因求解的公式计算量太大,一般题目中给出相关的量,如,,,等,便可直接代入求解.充分利用回归直线过样本中心点(,),即有= +,可确定. 2.独立性检验思想的理解 独立性检验的思想类似于反证法,即要确定“两个变量X与Y有关系”这一结论成立的可信度,首先假设结论不成立,即它们之间没有关系,也就是它们是相互独立的,利用概率的乘法公式可推知,(ad-bc)接近于零,也就是随机变量K2=应该很小,如果计算出来的K2的观测值k不是很小,通过查表P(K2≥k0)的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可以肯定地断言X与Y之间有关系. 1.判断下面结论是否正确(请在括号中打“√”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)K2=.( ) (3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( ) (4)任何一组数据都对应着一个回归直线方程.( ) 答案: (1) (2) (3)√ (4) 2.有关线性回归的说法,不正确的是( ) A.具有相关关系的两个变量是非确定关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.散点图中的点越集中,两个变量的相关性越强 答案: D 3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.( ) 附: P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 A.0.1% B.1% C.99% D.99.9% 解析: 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019-2020年高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 2019 2020 年高 数学 一轮 复习 第十 统计 案例 算法 初步 同步 练习

链接地址:https://www.zhuangpeitu.com/p-2535741.html