高中数学人教A版必修三第二章2.2.1用样本的频率分布估计总体分布教学设计
doc
2022-08-19 09:00:05
10页
2.2用样本估计总体§2.2.1用样本的频率分布估计总体分布一、教材分析教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.二、教学目标1、知识与技能(1)通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。2、过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。3、情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。三、重点难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总佒的分布.四、课时安排1课时五、教学设计(一)导入新课思路1在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).思路2如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.\n7月25日至8月10日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月8日至8月24日28.631.528.833.232.530.330.229.833.132.829.825.624.730.030.129.530.3怎样通过上表中的数据,分析比较两时间段内的高温(≥33℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.(二)推进新课、新知探究、提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)画频率分布直方图有哪些步骤?(4)频率分布直方图的特征是什么?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况.(2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.(3)其一般步骤为:①计算一组数据中最大值与最小值的差,即求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(4)频率分布直方图的特征:①从频率分布直方图可以清楚地看出数据分布的总体趋势.\n②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象.提出问题(1)什么是频率分布折线图?(2)什么是总体密度曲线?(3)对于任何一个总体,它的密度曲线是否一定存在?是否可以被非常准确地画出来?(4)什么叫茎叶图?画茎叶图的步骤有哪些?(5)茎叶图有什么特征?讨论结果:(1)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(3)实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(4)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.画茎叶图的步骤如下:①将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;③将各个数据的叶按大小次序写在其茎右(左)侧.(5)①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.(三)应用示例思路1\n例1有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果频数频率参加足球队(记为1)300.30参加篮球队(记为2)270.27参加排球队(记为3)230.23参加乒乓球队(记为4)200.20合计1001.00(2)由上表可知频率分布条形图如下:例2为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下:(单位:cm)154159166169159156166162158156166160164160157151157161158153158164158163158153157162159154165166157151146151160165158163163162161154165162159157159149164168159153列出样本的频率分布表;绘出频率分布直方图.解:第一步,求极差:上述60个数据中最大为169,最小为146.故极差为:169-146=23cm.第二步,确定组距和组数,可取组距为3cm,则组数为,可将全部数据分为8组.第三步,确定组限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5).第四步,列频率分布表:分组个数累计频数频率[145.5,148.5)10.017[148.5,151.5)30.050[151.5,154.5)60.100[154.5,157.5)80.133[157.5,160.5)180.300\n[160.5,163.5)110.183[163.5,166.5)100.167[166.5,169.5)30.050合计601.000第五步,根据上述数据绘制频率分布直方图如下图:以上例1和例2两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.例3从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174170165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:分组频数累计频数频率[150.5,153.5)440.04[153.5,156.5)1280.08\n[156.5,159.5)2080.08[159.5,162.5)31110.11[162.5,165.5)53220.22[165.5,168.5)72190.19[168.5,171.5)86140.14[171.5,174.5)9370.07[174.5,177.5)9740.04[177.5,180.5)10030.03合计1001根据频率分布表可以估计,估计身高不小于170的同学所占的百分率为:[0.14×+0.07+0.04+0.03]×100%=21%.点评:一般地,编制频率分布表的步骤如下:(1)求极差,决定组数和组距;(2)分组,通常对组内的数值所在的区间取左闭右开区间;(3)登记频数,计算频率,列出频率分布表.思路2例1下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158)人数116520(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)其频率分布直方图如下:\n(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.例2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:=0.08;又因为频率=,所以样本容量==150.(2)由图可估计该学校高一学生的达标率约为×100%=88%.例3甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.\n甲:12,15,24,25,31,31,36,36,37,39,44,49,50;乙:8,13,14,16,23,26,28,33,38,39,51.解:画出两人得分的茎叶图如下:从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好.(四)知能训练1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分答案:A2.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91%B.92%C.95%D.30%答案:A3.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(10,50)上的频率为()A.0.5B.0.7C.0.25D.0.05答案:B4.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭____________万盒.\n快餐公司个数情况图快餐公司盒饭年销售量的平均数情况图答案:85(五)拓展提升为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少?周长不小于120cm的树木约占多少?解:(1)这组数据的最大值为135,最小值为80,极差为55,可将其分为11组,组距为5.频率分布表如下:分组频数频率频率/组距[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计10010.2(2)直方图如下图:\n(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100cm的树木约占21%,周长不小于120cm的树木约占19%.(六)课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.(七)作业习题2.2A组1、2.