您的当前位置:首页人教B版高中数学必修3同步练习 第2章 章末复习

人教B版高中数学必修3同步练习 第2章 章末复习

2023-06-21 来源:飒榕旅游知识分享网


章末复习

学习目标 1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.3.能利用散点图对两个变量是否相关进行初步判断,能用回归直线方程进行预测.

1.抽样方法

(1)用随机数表法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.

N

(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k=;如果总体容量N不能被样本

nK

容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k=(其中K=N-多余个体数).

n(3)三种抽样方法的异同点

类别 简单随机抽样 抽样过程中每系统抽样 个个体被抽到的可能分层抽样 性相同 将总体分成几层,按各层个体数之比抽取 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 在各层抽样时采用简单随机抽样或系统抽样 共同点 各自特点 从总体中逐个抽取 相互联系 适用范围 总体中的个体数较少 总体中的个体数较多 总体由差异明显的几部分组成

2.用样本估计总体 (1)用样本估计总体

用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便. (2)样本的数字特征

样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差. 3.变量间的相关关系

(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确

定性关系(函数关系). (2)求回归直线方程的步骤:

n

2i

n

①先把数据制成表,从表中计算出x,y,i∑x,i∑xiyi; =1=1

?b=∑xy-nx y,

∑x-nx②计算回归系数a,b.公式为?

?a=y-bx.

^

i=1

ii

^

^

ni=1

2i

2

^

^

^

^

^

n

③写出回归直线方程y=bx+a.

题型一 用样本的频率分布估计总体

例1 某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:

40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96 (1)完成下面的频率分布表,并画出频率分布直方图;

分组 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03] 合计

(2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数为10 000,试根据抽样检查结果估计这批产品的合格个数. 解 (1)频率分布表如下:

分组 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]

频数 频率 频数 2 4 10 4 频率 0.10 0.20 0.50 0.20

合计

频率分布直方图如图:

20 1.00

17

(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴合格品频率为×100%=85%.

20∴10 000×85%=8 500.故根据抽样检查结果,可以估计这批产品的合格个数为8 500.

反思与感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.

跟踪训练1 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )

A.64 B.54 C.48 D.27 答案 B

解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22, ∴a=(0.22+0.32)×100=54.

题型二 用样本的数字特征估计总体的数字特征

例2 某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如表:

家庭人均月收入/元 工作人员数 管理人员数 [200,500) 20 5 [500,800) 60 10 [800, [1 100, 1 100) 1 400) 200 50 2

[1 400,1 700] 40 15 合计 400 100 80 20 求:(1)工作人员家庭人均月收入的估计值x1及方差的估计值s1;

(2)管理人员家庭人均月收入的估计值x2及方差的估计值s2; (3)总体人均月收入的估计值x及总体方差的估计值s. 解 (1)x1=s1=

2

2

2

1

×(20×350+60×650+200×950+80×1 250+40×1 550)=995, 400

12222

×[20×(350-995)+60×(650-995)+200×(950-995)+80×(1 250-995)+40×(1 550-400

2

995)]=83 475. (2)x2=

1

×(5×350+10×650+50×950+20×1 250+15×1 550)=1 040, 100

122222

s2=×[5×(350-1 040)+10×(650-1 040)+50×(950-1 040)+20×(1 250-1 040)+15×(1 550

100-1 040)]=90 900. (3)x=

1

×(25×350+70×650+250×950+100×1 250+55×1 550)=1 004, 500

2

122222

s=×[25×(350-1 004)+70×(650-1 004)+250×(950-1 004)+100×(1 250-1 004)+55×(1

500550-1 004)]=85 284.

反思与感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.

跟踪训练2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测数据如下:

甲 乙

问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?

解 甲的平均成绩为x甲=74,乙的平均成绩为x乙=73.所以甲的平均成绩好.

112222222222

甲的方差是s甲=[(-14)+6+(-4)+16+(-4)]=104,乙的方差是s乙=×[7+(-13)+(-3)+

557+2]=56.

因为s甲>s乙,所以乙的各门功课发展较平衡. 题型三 用回归直线方程对总体进行估计

例3 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:

零件的个数x(个) 加工的时间y(小时)

2

2

2

2

2

60 80 80 60 70 70 90 80 70 75 2 2.5 3 3 4 4 5 4.5

n

?xiyi-nx

^

i=1

y

^

^

(注:b=

n

i-nx?x2i=1

2

,a=y-b x)

(1)在给定的坐标系中画出表中数据的散点图;

^

^

^

(2)求出y关于x的回归直线方程y=bx+a,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时? 解 (1)散点图如图.

4

(2)由表中数据得:?xiyi=52.5,

i=1

4

x=3.5,y=3.5,?xi=54,

2i=1

^

^

∴b =0.7,∴a=1.05,

^

∴y=0.7x+1.05,回归直线如图所示.

(3)将x=10代入回归直线方程,

^

得y=0.7×10+1.05=8.05,

故预测加工10个零件约需要8.05小时.

反思与感悟 对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量

是否具有线性相关关系,如果具有,就可以应用最小二乘法求回归直线方程.由于样本可以反映总体,所以可以利用所求的回归直线方程,对这两个变量所确定的总体进行估计,即根据一个变量的取值,预测另一个变量的取值.

跟踪训练3 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:

年份202x(年) 人口数y(十万)

(1)请画出上表数据的散点图; (2)指出x与y是否线性相关;

^

^

^

0 5 1 7 2 8 3 11 4 19 (3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程y=bx+a; (4)据此估计2025年该城市人口总数.

(参数数据:0×5+1×7+2×8+3×11+4×19=132,0+1+2+3+4=30) 解 (1)数据的散点图如图:

2

2

2

2

2

(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关. 11

(3)由表知x=×(0+1+2+3+4)=2,y=×(5+7+8+11+19)=10.

55

5

?xiyi-5x

^

i=1

y

^

^

∴b=

5

i-5x?x2i=1

2

=3.2,a=y-bx=3.6,

^

∴回归直线方程为y=3.2x+3.6.

^

(4)当x=5时,y=19.6(十万)=196万. 故2025年该城市人口总数约为196万.

1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的( ) A.频数 频率C. 组距答案 B

2.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是( ) A.1 C.3 答案 B

解析 设这10个数为a1,a2,…,a10, 则有a1+a2+…+a10=200, 且a1+a2+…+a10=40,

?a1-4?+?a2-4?+…+?a10-4?所以

10a1+a2+…+a10-8?a1+a2+…+a10?+160=

10=

200-8×40+160

=4,∴标准差为4=2.

10

2

2

2

2

2

2

2

2

2

B.频率 D.以上都不对

B.2 D.4

3.某班50名学生的一次数学质量测验成绩的频率分布直方图如图所示,则成绩不低于70分的学生人数是____________________________________________________.

答案 35

解析 低于70分的频率为(0.012+0.018)×10=0.3,所以不低于70分的频率为0.7,故不低于70分的人数为 50×0.7=35.

^

4.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归直线方程是y=4x+250,则当施肥量为50 kg时,可以预测小麦的产量为________kg. 答案 450

^

解析 直接将x=50代入回归直线方程中,可得y=4×50+250=450.

5.从某学校的800名男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.

(1)求第七组的频率;

(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的人数.

4

解 (1)第六组的频率为=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)

50=0.06.

(2)身高在第一组[155,160)的频率为0.008×5=0.04, 身高在第二组[160,165)的频率为0.016×5=0.08, 身高在第三组[165,170)的频率为0.04×5=0.2, 身高在第四组[170,175)的频率为0.04×5=0.2,

由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5, 估计这所学校的800名男生的身高的中位数为m, 则170<m<175,

由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5, 所以可估计这所学校的800名男生的身高的中位数为174.5, 由直方图得后三组频率之和为0.06+0.08+0.008×5=0.18, 所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.

1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:

?1?纵轴表示频率/组距;?2?频率分布直方图中各小长方形高的比就是相应各组的频率之比;?3?直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.

2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.

一、选择题

1.在某次商品促销活动中,某人可得到4件不同的奖品,这些奖品要从40件不同的奖品中随机抽取决定.用系统抽样的方法确定这个人所得到的4件奖品的编号,有可能的是( ) A.3,9,15,11 C.8,20,32,40 答案 D

解析 由系统抽样的方法可知,这个人所得到的4件奖品的编号的间隔相等,且平均分布在1~10,11~20,21~30,31~40中,故A,B,C均不正确,D正确.

2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n等于( ) A.100 B.150 C.200 D.250 答案 A

n70解析 ∵=,∴n=100.

3 500+1 5003 500

3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为x,则( )

B.3,12,21,40 D.2,12,22,32

A.me=mo=x C.me<mo<x 答案 D

5+6

解析 30个数中第15个数是5,第16个数是6,所以中位数me==5.5,众数mo=5,

23×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2179

平均值x==,∴mo3030

4.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )

A.50 B.40 C.25 D.20 答案 C

B.me=mo<x D.mo<me<x

1 000

解析 间隔==25.

40

5.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n等于( ) A.54 B.90 C.45 D.126 答案 B

183

解析 分层抽样的核心是等比例抽取.所以=,解得n=90.

n15

6.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为( )

A.18 B.36 C.54 D.72 答案 B

解析 ∵样本数据落在[10,12]内的频率为 1-2×(0.02+0.05+0.15+0.19) =1-0.82 =0.18,

∴频数为200×0.18=36.

2

7.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为,则第三组的频

9数为( )

A.16 B.24 C.32 D.48 答案 B

频数2

解析 因为频率=,所以第二、四组的频数都为72×=16.所以第三组的频数为72-2×8-2×

样本容量916=24.

8.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x和s,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x,s+100

2

2

2

B.x+100,s+100

22

C.x,s 答案 D

2

D.x+100,s

2

解析 设工资增加后员工下月工资的平均数和方差分别为y,sy,据已知易得 y=

x1+x2+…+x10+10×100

=x+100,

10

[x1+100-?x+100?]+…+[x10+100-?x+100?]

10

2

2

2

又sy==s,故选D. 二、填空题

2

2

9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):

甲 乙

如果甲、乙两人中只有1人入选,那么入选的最佳人选应是________. 答案 甲

122

解析 x甲=9,x乙=9,s甲=×2=,

55162

s乙=×6=,甲的方差较小,成绩较稳定.

55

10.某校高中年级开设了丰富多彩的课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如图).s1,s2分别表示甲、乙两班抽取的5名学生学分的标准差,则s1______s2.(填“>”“<”或“=”)

10 10 8 10 9 7 9 9 9 9

答案 <

解析 标准差反映了数据的离散程度.显然甲的学分更集中.也可用公式计算得出.

11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.

答案 24 23

1

解析 x甲=(19+18+20×2+21+22+23+31×2+35)=24,

101

x乙=(19+17+11+21+22+24×2+30×2+32)=23.

10

12.某电子商务公司对10 000名网络购物者在2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a=________;

(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.

答案 (1)3 (2)6 000

解析 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. 三、解答题

13.下面是60名男生每分钟脉搏跳动次数的频率分布表.

分组 [51.5,57.5) [57.5,63.5) [63.5,69.5) [69.5,75.5) [75.5,81.5) [81.5,87.5) [87.5,93.5]

(1)作出频率分布直方图;

(2)根据直方图的各组中值估计总体平均数;

(3)已知标准差s≈8.784,估计每分钟脉搏跳动次数的范围. 解 (1)频率分布直方图如图.

频数 4 6 11 20 11 5 3 频率 0.067 0.1 0.183 0.334 0.183 0.083 0.05 频率/组距 0.011 0.017 0.031 0.056 0.031 0.014 0.008

(2)由各组中值估计总体平均数为(54.5×4+60.5×6+66.5×11+72.5×20+78.5×11+84.5×5+90.5×3)÷60=72. (3)∵s≈8.784,

∴每分钟脉搏跳动次数的范围大致为[x-s,x+s],即[63.216,80.784],取整数为[63,81].

14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:

(1)估计这次考试的众数m与中位数n(结果保留一位小数); (2)估计这次考试的及格率(60分及以上为及格)和平均分. 解 (1)众数是最高小矩形底边中点的横坐标, ∴众数为m=75.

前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4. ∵中位数平分直方图的面积, 0.5-0.4

∴n=70+×10≈73.3.

0.3

(2)依题意60分及以上的分数所在的第三、四、五、六组的频率和为(0.015+0.03+0.025+0.005)×10=0.75,

∴抽样学生成绩的合格率是75%. 利用组中值估算抽样学生的平均分为

45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71. 估计这次考试的平均分是71分.

因篇幅问题不能全部显示,请点此查看更多更全内容