概率与统计(解答题)——大数据之五年(2018-2022)高考真题汇编(新高考卷与全国理科)解析版
docx
2023-07-06 10:20:05
14页
概率与统计(解答题)——大数据之五年(2018-2022)高考真题汇编(新高考卷与全国理科)一、解答题1.在某地区进行流行病调查,随机调查了100名某种疾病患者的年龄,得到如下的样本数据频率分布直方图.(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值作代表);(2)估计该地区一人患这种疾病年龄在区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%,从该地区任选一人,若此人年龄位于区间[40,50),求此人患该种疾病的概率.(样本数据中的患者年龄位于各区间的频率作为患者年龄位于该区间的概率,精确到0.0001)【答案】(1)解:平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁)(2)解:设A={一人患这种疾病的年龄在区间[20,70)},则P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种族病},则由条件概率公式,得P(C∣B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014【知识点】频率分布直方图;众数、中位数、平均数;互斥事件与对立事件;条件概率与独立事件【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P(A)即可解出;(3)根据条件概率公式即可求出.2.甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.【答案】(1)解:设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(ABC)+P(ABC)+P(ABC)=0.16+0.16+0.24+0.04=0.6.(2)解:依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为X0102030P0.160.440.340.06期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13【知识点】互斥事件的概率加法公式;相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.3.甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表: 准点班次数未准点班次数A24020B21030附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),P(K2⩾k)0.1000.0500.010k2.7063.8416.635(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?【答案】(1)解:由表中数据可知,A共有班次240+20=260次,准点班次有240次,设A家公司长途客车准点事件为M,则P(M)=240260=1213;则A家公司长途客车准点的概率为1213;nB共有班次210+30=240次,准点班次有210次,设B家公司长途客车准点事件为N,则P(N)=210240=78.B家公司长途客车准点的概率为78.(2)解:列联表 准点班次数未准点班次数合计A24020260B21030240合计45050500K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30−210×20)2260×240×450×50≈3.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.【知识点】独立性检验的应用;古典概型及其概率计算公式【解析】【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算K2,再利用临界值表比较即可得结论.4.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,1.896≈1.377.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.【答案】(1)解:样本中10棵这种树木的根部横截面积的平均值x=0.610=0.06样本中10棵这种树木的材积量的平均值y=3.910=0.39据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,平均一棵的材积量为0.39m3(2)解:r=i=110(xi−x)(yi−y)i=110(xi−x)2i=110(yi−y)2=i=110xiyi−10xy(i=110xi2−10x2)(i=110yi2−10y2)=0.2474−10×0.06×0.39(0.038−10×0.062)(1.6158−10×0.392)=0.01340.0001896≈0.01340.01377≈0.97则r≈0.97(3)解:设该林区这种树木的总材积量的估计值为Ym3,又已知树木的材积量与其根部横截面积近似成正比,可得0.060.39=186Y,解之得Y=1209m3.则该林区这种树木的总材积量估计为1209m3【知识点】众数、中位数、平均数;相关系数【解析】【分析】(1)计算出样本中10棵这种树木根部横截面积的平均值及10棵这种树木材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)根据相关系数公式计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.5.在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖,为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立(I)估计甲在校运动会铅球比赛中获得优秀奖的概率;(II)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望EX;(III)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(I)由题意得:设甲在校运会铅球比赛中获优秀奖为事件A:n比赛成绩达到9.50m以上获优秀奖,甲的比赛成绩达到9.50以上的有:9.80,9.70,9.55,9.54四个,所以甲在校运会铅球比赛中获优秀奖的概率为P(A)=0.4;(II)X所有可能取值为0,1,2,3甲在校运会铅球比赛中获优秀奖的概率为P(A)=0.4乙在校运会铅球比赛中获优秀奖的概率为事件B,则P(B)=0.5丙在校运会铅球比赛中获优秀奖的概率为事件C,则P(C)=0.5P(X=0)=0.6×0.5×0.5=0.15P(X=1)=0.4×0.5×0.5+0.6×0.5×0.5+0.6×0.5×0.5=0.4P(X=2)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=0.35P(X=3)=0.4×0.5×0.5=0.1X0123P0.150.40.350.1E(X)=0×0.15+1×0.4+2×0.35+3×0.1=1.4(III)甲的平均数:(9.80+9.70+9.55+9.54+9.48+9.42+9.40+9.35+9.30+9.25)×0.1=9.479乙的平均数:(9.78+9.56+9.51+9.36+9.32+9.23)÷6=9.457丙的平均数:(9.85+9.65+9.20+9.16)×0.25=9.465甲的方差:S2=[(9.8-9.479)2+⋯+(9.25-9.479)2]÷10=0.172乙的方差:S2=[(9.78-9.457)2+⋯+(9.23-9.457)2]÷6=0.0329丙的方差:S2=[(9.85-9.465)2+⋯+(9.16-9.465)2]÷4=0.086在校运动会铅球比赛中,乙获得冠军的概率估计值最大.【知识点】极差、方差与标准差;古典概型及其概率计算公式;离散型随机变量及其分布列;离散型随机变量的期望与方差【解析】【分析】(1)根据古典概型概率公式计算即可;(2)由题意X的可能取值为0,1,2,3,先分别求得甲、乙、丙在校运会铅球比赛中获优秀奖的概率,再分别求取X取值的相应概率,由此得分布列和数学期望;(3)根据甲、乙、丙的比赛成绩的平均值和方差即可判断.6.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在己患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据: 不够良好良好病例组4060对照组1090附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥k)0.0500.0100.001K3.8416.63510.828(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,P(B∣A)P(B∣A)与P(B∣A)P(B∣A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(i)证明:R=P(A∣B)P(A∣B)⋅P(A∣B)P(A∣B);(ii)利用该调查数据,给出P(A|B),P(A∣B)的估计值,并利用(i)的结果给出R的估计值.【答案】(1)K2=200×(40×90−10×60)2100×100×50×150=24>6.625所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)用局部估计总体(i)R=P(B∣A)P(B∣A)÷P(B∣A)P(B∣A)=P(B∣A)⋅P(B∣A)P(B∣A)⋅P(B∣A)=P(AB)P(A)⋅P(BA)P(A)P(BA)P(A)⋅P(BA)P(A)=P(AB)⋅P(BA)P(BA)⋅P(BA)=P(AB)P(B)⋅P(BA)P(B)P(BA)P(B)⋅P(BA)P(B)=P(A∣B)⋅P(A∣B)P(A∣B)⋅P(A∣B)(ii)P(A∣B)=P(AB)P(B)=n(AB)n(B)=40100, P(A∣B)=P(AB)P(B)=n(AB)n(B)=90100P(A∣B)=P(AB)P(B)=n(AB)n(B)=60100, P(A∣B)=P(AB)P(B)=n(AB)n(B)=10100R=40×9060×10=6故R的估计值为6【知识点】独立性检验的应用;条件概率与独立事件【解析】【分析】(1)代入数据,求得K2,再对出表格,即可得结论;(2)(ⅰ)根据新定义,结合条件概率的计算公式,即可证明;(ⅱ)由条件概率的计算公式分别求得P(A∣B),P(A∣B),P(A∣B), P(A∣B),再代入R,求解即可.n7.一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3).(1)已知p0=0.4,p1=0.3,p2=0.2,p3=0.1,求E(X);(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1时,p<1;(3)根据你的理解说明(2)问结论的实际含义.【答案】(1)E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.(2)设f(x)=p3x3+p2x2+(p1−1)x+p0,因为p3+p2+p1+p0=1,故f(x)=p3x3+p2x2−(p2+p0+p3)x+p0,若E(X)≤1,则p1+2p2+3p3≤1,故p2+2p3≤p0.f′(x)=3p3x2+2p2x−(p2+p0+p3),因为f′(0)=−(p2+p0+p3)<0,f′(1)=p2+2p3−p0≤0,故f′(x)有两个不同零点x1,x2,且x1<0<1≤x2,且x∈(−∞,x1)∪(x2,+∞)时,f′(x)>0;x∈(x1,x2)时,f′(x)<0;故f(x)在(−∞,x1),(x2,+∞)上为增函数,在(x1,x2)上为减函数,若x2=1,因为f(x)在(x2,+∞)为增函数且f(1)=0,而当x∈(0,x2)时,因为f(x)在(x1,x2)上为减函数,故f(x)>f(x2)=f(1)=0,故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,若x2>1,因为f(1)=0且在(0,x2)上为减函数,故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,综上,若E(X)≤1,则p=1.若E(X)>1,则p1+2p2+3p3>1,故p2+2p3>p0.此时f′(0)=−(p2+p0+p3)<0,f′(1)=p2+2p3−p0>0,故f′(x)有两个不同零点x3,x4,且x3<0<x4<1,且x∈(−∞,x3)∪(x4,+∞)时,f′(x)>0;x∈(x3,x4)时,f′(x)<0;故f(x)在(−∞,x3),(x4,+∞)上为增函数,在(x3,x4)上为减函数,而f(1)=0,故f(x4)<0,又f(0)=p0>0,故f(x)在(0,x4)存在一个零点p,且p<1.所以p为p0+p1x+p2x2+p3x3=x的一个最小正实根,此时p<1,故当E(X)>1时,p<1.(3)每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.【知识点】利用导数研究函数的单调性;利用导数研究函数的极值;离散型随机变量的期望与方差【解析】【分析】(1)利用公式计算可得E(X).(2)利用导数讨论函数的单调性,结合f(1)=0及极值点的范围可得f(x)的最小正零点.(3)利用期望的意义及根的范围可得相应的理解说明.8.为加快新冠肺炎检测效率,某检测机构采取“k合1检测法”,即将k个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X为总检测次数,求检测次数X的分布列和数学期望E(X);(2)若采用“5合1检测法”,检测次数Y的期望为E(Y),试比较E(X)和E(Y)的大小(直接写出结果).【答案】(1)①对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;所以总检测次数为20次;②由题意,X可以取20,30,P(X=20)=111,P(X=30)=1−111=1011,则X的分布列:X2030P1111011所以E(X)=20×111+30×1011=32011;(2)由题意,Y可以取25,30,设两名感染者在同一组的概率为p,P(Y=25)=p,P(Y=30)=1−p,则E(Y)=25p+30(1−p)=30−5p,若p=211时,E(X)=E(Y);若p>211时,E(X)>E(Y);若p<211时,E(X)<E(Y).【知识点】简单随机抽样;互斥事件与对立事件;离散型随机变量及其分布列;离散型随机变量的期望与方差n【解析】【分析】(1)①根据“k合1检测法”,结合随机抽样的定义求解即可;②根据“k合1检测法”,以及对立事件的概率,结合离散型随机变量的分布列和期望求解即可;(2)根据“k合1检测法”,以及对立事件的概率,结合离散型随机变量的期望求解即可.9.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表: 一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)【答案】(1)(1)由题意可知:甲机床生产的产品中一级品的频率是:150200=34乙机床生产的产品中一级品的频率是:120200=35(2)由于K2=400+(150×80−50×120)2270×130×200×200=40039≈10.256>6.635所以,有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异。【知识点】频率分布表;独立性检验;独立性检验的应用【解析】【分析】(1)根据频率=频数/总体直接求解即可;(2)根据独立性检验的方法直接求解即可.10.某厂研究了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和s22(1)求x,y,s12,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s12+s222,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)解:各项所求值如下所示x=110(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.0y=110(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3s12=110x[(9.7-10.0)2+2x(9.8-10.0)2+(9.9-10.0)2+2X(10.0-10.0)2+(10.1-10.0)2+2x(10.2-10.0)2+(10.3-10.0)2]=0.36,s22=110x[(10.0-10.3)2+3x(10.1-10.3)2+(10.3-10.3)2+2x(10.4-10.3)2+2x(10.5-10.3)2+(10.6-10.3)2]=0.4.(2)由(1)中数据得y-x=0.3,2s12+s2210≈0.551显然y-x<2s12+s2210,所以不认为新设备生产产品的该项指标的均值较旧设备有显著提高。【知识点】众数、中位数、平均数;极差、方差与标准差【解析】【分析】(1)先计算新旧样本平均数x,y,再直接用公式计算s12,s22;(2)由(1)中的数据,计算得:y-x=0.3,2s12+s2210≈0.34,显然y-x<2s12+s2210,可得到答案。11.某学校组织"一带一路”知识竞赛,有A,B两类问题・每位参加比赛的同学先在两类问题中选择类并从中随机抽収一个问题冋答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分:B类问题中的每个问题回答正确得80分,否则得0分。已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6.且能正确回答问题的概率与回答次序无关。(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列:(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由。【答案】(1)X的取值可能为0,20,100,P(X=0)=1−0.8=0.2,P(X=20)=0.8×(1−0.6)=0.32,P(X=100)=0.8×0.6=0.48,∴X的分布列为X020100P0.20.320.48(2)假设先答B类题,得分为Y,则Y可能为0,80,100,P(Y=0)=1−0.6=0.4,P(Y=80)=0.6×(1−0.8)=0.12,nP(Y=100)=0.6×0.8=0.48,∴Y的分布列为Y080100P0.40.120.48∴E(Y)=0×0.4+80×0.12+100×0.48=57.6,由(1)可知E(X)=0×0.2+20×0.32+100×0.48=54.4,∴E(Y)>E(X),∴应先答B类题.【知识点】相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差【解析】【分析】(1)根据独立事件的概率,并列出X的分布列即可;(2)根据独立事件的概率,并列出Y的分布列,根据期望公式求得E(X),E(Y)并比较即可判断.12.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次≤400人次>400空气质量好 空气质量不好 【答案】(1)解:由频数分布表可知,该市一天的空气质量等级为1的概率为2+16+25100=0.43,等级为2的概率为5+10+12100=0.27,等级为3的概率为6+7+8100=0.21,等级为4的概率为7+2+0100=0.09(2)解:由频数分布表可知,一天中到该公园锻炼的人次的平均数为100×20+300×35+500×45100=350(3)解:2×2列联表如下: 人次≤400人次>400空气质量不好3337空气质量好228K2=100×(33×8−37×22)255×45×70×30≈5.820>3.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【知识点】独立性检验的应用;概率的应用【解析】【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善2×2列联表,计算出K2的观测值,再结合临界值表可得结论.13.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1200,i=120(xi−x)2=80,i=120(yi−y)2=9000,i=120(xi−x)(yi−y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,2=1.414.n【答案】(1)解:样区野生动物平均数为120i=120yi=120×1200=60,地块数为200,该地区这种野生动物的估计值为200×60=12000(2)解:样本(xi,yi)的相关系数为r=i=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2=80080×9000=223≈0.94(3)解:由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样法抽取样本即可.【知识点】分层抽样方法;随机抽样和样本估计总体的实际应用;两个变量的线性相关【解析】【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式r=i=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.14.甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【答案】(1)解:记事件M:甲连胜四场,则P(M)=(12)4=116;(2)解:记事件A为甲输,事件B为乙输,事件C为丙输,则四局内结束比赛的概率为P′=P(ABAB)+P(ACAC)+P(BCBC)+P(BABA)=4×(12)4=14,所以,需要进行第五场比赛的概率为P=1−P′=34;(3)解:记事件A为甲输,事件B为乙输,事件C为丙输,记事件M:甲赢,记事件N:丙赢,则甲赢的基本事件包括:BCBC、ABCBC、ACBCB、BABCC、BACBC、BCACB、BCABC、BCBAC,所以,甲赢的概率为P(M)=(12)4+7×(12)5=932.由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为P(N)=1−2×932=716.【知识点】相互独立事件的概率乘法公式;列举法计算基本事件数及事件发生的概率【解析】【分析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率.15.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,475] [0,35]32184(35,75]6812(75,115]3710附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75] (75,115] (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关n?【答案】(1)解:由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为64100=0.64;(2)解:由所给数据,可得2×2列联表为:SO2PM2.5[0,150](150,475]合计[0,75]641680(75,115]101020合计7426100(3)解:根据2×2列联表中的数据可得K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10−16×10)280×20×74×26=3600481≈7.4844>6.635,因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.【知识点】独立性检验的应用;古典概型及其概率计算公式【解析】【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得2×2列联表;(3)计算出K2,结合临界值表可得结论.16.某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表: 男生女生支持不支持支持不支持方案一200人400人300人100人方案二350人250人150人250人假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为p0,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为p1,试比较p0与p1的大小.(结论不要求证明)【答案】解:(Ⅰ)该校男生支持方案一的概率为200200+400=13,该校女生支持方案一的概率为300300+100=34;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:(13)2(1−34)+C21(13)(1−13)34=1336;(Ⅲ)p1<p0【知识点】相互独立事件的概率乘法公式;古典概型及其概率计算公式;分类加法计数原理【解析】【分析】(Ⅰ)根据频率估计概率,即得结果;(Ⅱ)先分类,再根据独立事件概率乘法公式以及分类计数加法公式求结果;(Ⅲ)先求p0,再根据频率估计概率p1,即得大小.17.在平面直角坐标系xOy中,设点集An={(0,0),(1,0),(2,0),…,(n,0)},Bn={(0,1),(n,1)},Cn={(0,2),(1,2),(2,2),⋯,(n,2)},n∈N∗.令Mn=An∪Bn∪Cn.从集合Mn中任取两个不同的点,用随机变量X表示它们之间的距离.(1)当n=1时,求X的概率分布;(2)对给定的正整数n(n≥3),求概率P(X≤n)(用n表示).【答案】(1)解:当n=1时,X的所有可能取值是1 , 2 , 2 , 5.X的概率分布为P(X=1)=7C62=715,P(X=2)=4C62=415,P(X=2)=2C62=215,P(X=5)=2C62=215(2)解:设A(a , b)和B(c , d)是从Mn中取出的两个点.因为P(X≤n)=1−P(X>n),所以仅需考虑X>n的情况.①若b=d,则AB≤n,不存在X>n的取法;②若b=0 , d=1,则AB=(a−c)2+1≤n2+1,所以X>n当且仅当AB=n2+1,此时a=0 , c=n或a=n , c=0,有2种取法;③若b=0 , d=2,则AB=(a−c)2+4≤n2+4,因为当n≥3时,(n−1)2+4≤n,所以X>n当且仅当AB=n2+4,此时a=0 , c=n或a=n , c=0,有2种取法;④若b=1 , d=2,则AB=(a−c)2+1≤n2+1,所以X>n当且仅当AB=n2+1,此时a=0 , c=n或a=n , c=0,有2种取法.综上,当X>n时,X的所有可能取值是n2+1和n2+4,且P(X=n2+1)=4C2n+42,P(X=n2+4)=2C2n+42.因此,P(X≤n)=1−P(X=n2+1)−P(X=n2+4)=1−6C2n+42n【知识点】离散型随机变量及其分布列;正态分布曲线的特点及曲线所表示的意义【解析】【分析】利用已知条件求出离散型随机变量X的概率分布。(2)设A(a , b)和B(c , d)是从Mn中取出的两个点.因为P(X≤n)=1−P(X>n),所以仅需考虑X>n的情况,再利用分类讨论的方法结合求最值的方法得出a,c的取值的取法,从而求出当X>n时,X的所有可能取值是n2+1和n2+4,且P(X=n2+1)=4C2n+42,P(X=n2+4)=2C2n+42,因此,求出用n表示的概率P(X≤n)为:P(X≤n)=1−P(X=n2+1)−P(X=n2+4)=1−6C2n+42。18.2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(Ⅰ)应从老、中、青员工中分别抽取多少人?(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如右表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目ABCDEF子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.【答案】解:(1)由已知,老、中、青员工人数之比为6:9:10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员中分别抽取6人,9人,10人.(Ⅱ)(i)从已知的6人中随机抽取2人的所有可能结果为,共15种.(公式显示不全)(ii)由表格知,符合题意的所有可能结果为{A,B}{A,E}{A,D}{A,F}{B,D}{B,E}{B,F}{C,E}{C,F}{D,F}{E,F},共11种.所以,事件M发生的概率P(M)=1115【知识点】分层抽样方法;列举法计算基本事件数及事件发生的概率【解析】【分析】(Ⅰ)根据老、中、青员工人数之比为6:9:10,采用分层抽样,从中抽取25人调查,分别求出应从老、中、青员工中分别抽取的人数;(Ⅱ)(ⅰ)根据题意列举出从6人中随机抽取2人接受采访可能出现的结果;(ⅱ)根据表格所给条件求出事件M出现的情况有多少种,进而求出事件M发生的概率。19.设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(Ⅰ)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(Ⅱ)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.【答案】解:(Ⅰ)解:因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故X~B(3,23),从而P(X=k)=C3k(23)k(13)3−k, k=0,1,2,3.所以,随机变量X的分布列为X0123P1272949827随机变量X的数学期望E(X)=3×23=2.(Ⅱ)设乙同学上学期间的三天中7:30之前到校的天数为Y,则Y~B(3,23),且M={X=3,Y=1}∪{X=2,Y=0}.由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,从而由(Ⅰ)知P(M)=P({X=3,Y=1}∪{X=2,Y=0})=P(X=3,Y=1)+P(X=2,Y=0)=P(X=3)P(Y=1)+P(X=2)P(Y=0)=827×29+49×127=20243【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型【解析】【分析】本题主要考查随机变量及其分布列和数学期望,互斥事件和相互独立事件的概率计算公式。(Ⅰ)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,利用P(X=k)=C3k(23)k(13)3−k, k=0,1,2,3分别求出相应的概率,即可求出随机变量X的数学期望。n(Ⅱ)先列出发生事件M的几种情况,由题意知事件{X=3,Y=1}与{X=2,Y=0}互斥,且事件{X=3}与{Y=1},事件{X=2}与{Y=0}均相互独立,由此即可求出事件M发生的概率。20.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同。经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲,乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)【答案】(1)解:由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.【知识点】频率分布直方图;众数、中位数、平均数【解析】【分析】(1)由已知利用频率分布直方图,百分比不低于5.5的估计值为0.70列式,即可求出a,b的值;(2)由频率分布直方图平均数的计算公式,利用区间的中点值为代表列式,即可求出平均值.21.11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)解:X=2就是10:10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–04)=05.(2)X=4且甲获胜,就是10:10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.【知识点】相互独立事件的概率乘法公式【解析】【分析】(1)第一问要求的概率,即把可能出现的情况列举出来,有两种情况分别为:①甲连赢两球,②乙连赢两球,再将两种情况的概率相加求和即可。(2)第二问与第一问类似,把可能出现的情况列举出来,有两种情况分别为:①甲赢第一球,乙赢第二球,甲赢第三球和第四球,②乙赢第一球,甲赢第二、第三和第四球,再将两种情况的概率相加求和即可。22.改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于2000元大于2000元仅使用A27人3人仅使用B24人1人(I)估计该校学生中上个月A,B两种支付方式都使用的人数;(II)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(III)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中,随机抽查1人,发现他本月的支付金额大于2000元,结合(II)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】解:(I)据估计,100人中上个月A、B两种支付方式都使用的人数为100-5-27-3-24-1=40人,故该校学生中上个月A、B两种支付方式都使用的人数为400人;(II)该校学生上个月仅使用B支付的共25人,其中支付金额大于2000的有一人,故概率为125;(III)不能确定人数有变化,因为在抽取样本时,每个个体被抽到的机会是均等的,也许抽取的样本恰为上个月支付超过2000的个体,因此不能从抽取的一个个体来确定本月的情况有变化.【知识点】用样本的频率分布估计总体分布;古典概型及其概率计算公式【解析】【分析】(I)根据题意,结合支付方式的分类直接计算,再根据样本估计总体即可;(II)根据古典概型,求出基本事件总数和符合题意的基本事件数,即可求出相应的概率;(III)从统计的角度,对事件发生的不确定性进行分析即可.23.改革开放以来,人们的支付方式发生了巨大转变。近年来,移动支付已成为主要支付方式之一。为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1000](1000,2000]大于2000仅使用A18人9人3人n仅使用B10人14人1人(I)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(II)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(III)已知上个月样本学生的支付方式在本月没有变化。现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元,根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】解:(I)抽取的100人中,A,B两种支付方式都使用的人数为100-5-18-9-3-10-14-1=40,设A,B两种支付方式都使用为事件A,则P(A)=40100=25,即A,B两种支付方式都使用的概率为25;(II)X的可能取值为0,1,2;其中P(X=0)=35×25=625,P(X=1)=35×35+25×25=1325,P(X=2)=25×35=625,所以分布列为X012P6251325625(III)不能认为样本仅使用A支付的学生中本月支付金额大于2000元的人数有变化,因为概率是在大量重复试验下得到的一个预测结合,不能确定是不是一定发生。【知识点】用样本的频率分布估计总体分布;古典概型及其概率计算公式【解析】【分析】(I)求出相应的人数,结合古典概型求出相应的概率即可;(II)求出离散型随机变量X的可能取值和相应的概率,即可得到相应的分布列;(III)根据概率的含义,从统计的角度进行分析即可.24.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验。试验方案如下:每一轮选取两只白鼠对药效进行对比试验。对于两只白鼠,随机选一只施以甲药,另一只施以乙药。一轮的治疗结果得出后,再安排下一轮试验。当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效。为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分:若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分:若都治愈或都未治愈则两种药均得0分。甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X。(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效“的概率,则P0=0,P8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1)。假设α=0.5,β=0.8。(i)证明:{Pi+1−Pi}(i=0,1,2,…,7)为等比数列;(ii)求P4,并根据P4的值解释这种试验方案的合理性。【答案】(1)解:P(X=-1)=(1−α)β,P(X=1)=(1−β)α,P(X=0)=(1−α)(1−β)+αβ,所以X的分布列为:X-101Pβ-αβ1+2αβ-α-βα-αβ(2)(i)证明:a=0.4,b=0.5,c=0.1,则5pi=4pi−1+pi+1(i=1,2,3,⋯,7),pi+1-pi=4(pi−pi−1),(i=1,2,3,⋯,7),pi+1−pipi−pi−1=4,利用等比数列的定义证出:数列{Pi+1−Pi}(i=0,1,2,…,7)为等比数列。(ii)pi+1-pi=4i(p1−p0)=pi·4i,p8=(p8−p7)+(p7−p6)+⋯(p1−p0)=(1+4+⋯+47)p1=1,p1=11+4+⋯+47=1−41−48=348−1,p4=(p4−p3)+(p3−p2)+(p2−p1)+p1=(1+4+⋯+43)p1=1257,表示在初始4分的情况下,甲药累计得分为4时,认为甲药比乙药更有效的概率仅为1257(<0.01),而事实上确实如此,因为乙药的治愈率大于甲药(0.8>0.5),故这种试验方案是合理的。【知识点】等比数列;离散型随机变量及其分布列【解析】【分析】(1)利用实际问题的已知条件求出离散型随机变量的分布列。(2)(i)利用实际问题的已知条件结合离散型随机变量的分布列,将实际问题转化为等比数列的问题,再利用等比数列的定义证出:数列{Pi+1−Pi}(i=0,1,2,…,7)为等比数列;(ii)由(i)证出的数列{Pi+1−Pi}(i=0,1,2,…,7)为等比数列求出等比数列{Pi+1−Pi}的通项公式,再利用累加法变形结合等比数列前n项和公式求出p4的值,再利用p4的值结合甲药比乙药更有效的概率仅为1257(<0.01),得出乙药的治愈率大于甲药(0.8>0.5),故这种试验方案是合理的。25.某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验。设每件产品为不合格的概率为品p(0<p<1),且各件产品是否为不合格品相互独立。(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为pn的值。已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用(i)若不对该箱余下的产品作检验,这一箱的检验费用与赔偿费用的和记为X,求EX;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案】(1)解:20件产品中恰有2件不合格品的概率为f(p)=C202p2(1−p)18.因此f′(p)=C202[2p(1−p)18−18p2(1−p)17]=2C202p(1−p)17(1−10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.(2)解:由(1)知,p=0.1.(i)令Y表示余下的180件产品中的不合格品件数,依题意知Y∼B(180,0.1),X=20×2+25Y,即X=40+25Y.所以EX=E(40+25Y)=40+25EY=490.(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于EX>400,故应该对余下的产品作检验.【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差【解析】【分析】(1)由20件产品恰有2件不合格的产品,则其余18件产品合格,得到f(p)的表达式,由导数研究函数的单调性求出最值;(2)由题意得到X的可能取值为2,27,求出X=2和X=27时对应的概率,得到分布列,再求期望值;(3)由于对每一箱产品都检验时费用为400元,由(2)中期望值为依据,则费用为900元,由此作出决定.26.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(Ⅰ)应从甲、乙、丙三个部门的员工中分别抽取多少人?(Ⅱ)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【答案】解:解:(Ⅰ)由已知甲乙丙三个部门员工人数之比为3:2:2,∴从甲乙丙三个部门中分别抽到3人,2人,2人(Ⅱ)(i)随机变量ξp(x=k)=C4k⋅C33−kC73(k=0,1,2,3)∴随机变量x的分布列为X0123P13512351835435∴x的数学期望为E(x)=0×135+1×1235+2×1835+3×435=127(ii)解:设事件B为:“抽取3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”,事件C为:“抽取3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且BC互斥由①知P(B)=P(x=2),P(C)=P(x=1)则:P(A)=P(B∪C)=P(x=2)+P(x=1)=67则事件A发生的概率为67.【知识点】离散型随机变量的期望与方差【解析】【分析】(Ⅰ)分层抽样对应成比例;(Ⅱ)概率分布列通式写出来,再算期望。27.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】解:(Ⅰ)∵240:160::160=3:2:2则应从甲乙丙三个年级的学习志愿者抽3人,2人,2人(Ⅱ)(i)共有如下情形ABACADAEAFAGBCBDBEBFBGCDCECFCGDEDFDGEFEGFG(ii)P=3+1+121=521.【知识点】列举法计算基本事件数及事件发生的概率【解析】【分析】(1)分层抽样,对应成比例;(2)(i)列举法依次列出来;(ii)古典概型.28.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图。为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型,根据2000年至2016年的数据(时间变量t的值依次为1,2,…….,17)建立模型①:y=-30.4+13.5t.根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由。【答案】(1)由题意可知模型①中,2018年对应的t=19,预测值y=-30.4+13.5×19=226.1亿元此时基础设施的投资预测值为226.1亿元;模型②中,2018年对应的t=9,预测值y=99+17.5×9=256.5亿元此时基础设施的投资预测值为:256.5亿元;n(2)用模型②预测得到的2018年的基础设施的投资更可靠。因为从折线图上看,基础设施的投资在2009年到2010年发生了很大程度上的突变,所以用模型①预测2018年的会有一定程度的失真。【知识点】线性回归方程【解析】【分析】(1)根据函数表达式可求预估值;(2)看图易知可靠性.29.某工厂为提高生产效率,开展技术创新活动,提出了完成项目生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随即分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据2中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)解:第二种生产方式效率更高,因为第二组多数数据集中在70min~80min之间,第一组多数数据集中在80min~90min,所以第一组完成任务的平均时间大于第二组,E1=i=120t120=84,E2=i=120t120=74.4∴E1>t1则第二种生产方式的效率更高。(2)解:由题意m=79+812=80 超过m不超过m第一种生产方式155第二种生产方式515(3)解:K2=40⋅(152−52)220⋅20⋅20⋅20=10>6.635有99%的把握认为两种生产方式的效率有差异【知识点】众数、中位数、平均数;独立性检验【解析】【分析】第一问是算平均数,第二三问是列出连表,算独立性检验.30.电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值假设所有电影是否获得好评相互独立。(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6),写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系。【答案】解:(Ⅰ)设时间A为:“这部电影是获得好评的第四类电影”则P(A)=200×0.25140+50+300+200+800+1510=140(Ⅱ)设时间B为“恰有一部获的好评”P(B)=0.25×(1−0.2)+(1−0.25)×0.8=0.35(Ⅲ)Dξ1=0.4⋅0.6=0.24Dξ2=Dξ5=0.2×0.8=0.016Dξ3=0.15⋅0.85=0.1275Dξ4=0.25⋅0.75=0.1875Dξ6=0.1×0.9=0.09∴Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6【知识点】相互独立事件的概率乘法公式;古典概型及其概率计算公式;离散型随机变量的期望与方差【解析】【分析】(1)古典概型,用第四类电影部数总部数;(2)相互独立事件,恰有一个发生概率,分类讨论是哪一部好评,(3)由方差定义直接写.31.电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1n好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】解:(Ⅰ)设时间A为:“这部电影是获得好评的第四类电影”则P(A)=200×0.25140+50+300+200+800+510=140(Ⅱ)获得好评的电影部数为:140×0.4+50×0.2+300×0.15+200×0.25+800×0.2×510×0.1=372估计这部电影没有获得好评的概率为:1-3722000=0.814.(Ⅲ)只要第五类电影的好评率增加0.1,第二类电影的好评率减少0.1,可使得获得好评的电影总部数与样本中的电影总部数的比值达到最大.【知识点】相互独立事件的概率乘法公式;古典概型及其概率计算公式;离散型随机变量的期望与方差【解析】【分析】(1)古典概型,用第四类电影部数总部数;(2)根据表格数据,求出获得好评的电影部数,从而可以求出这部电影没有获得好评的概率;(3)增加电影部数多的,减少电影部数少的.