2019 级《应用数理统计》复习题
1.解说下列名词术语
(1)试验总体
(2)总体指标
(3)样本
(4)样本分布
(5)抽样分布
(6)充分统计量
(7)小概率原理
(8)估计精度
(9)第一、二类错误
(10)检验功效
(11)方差齐性
(12)P-Value
(13)小概率原理
(14)枢轴变量
(15)检验统计量
(16)先验分布
(17)估计标准误
(18)有效估计量
(19)奇异点
(20)贝叶斯模型
2.解答下列各题
(1)单变量试验数据的描述指标有哪些,它们主要描述试验数据的什么特征?
(2)双变量间相关性刻画的指标有哪些,它们主要用于什么类型相依性的描述?
(3)如何在科技写作中以图形方式表达比较研究的试验数据,以便读者能理解试验结果?
(4)由试验数据探查与验证试验指标概率分布的方法有哪些,它们各自适用于什么情况?
(5)一批砖出售前要抽检其抗压强度(单位:Mpa),现从这批砖中随机抽取 10 块砖,测得
其抗压强度分别为
4.7,10.1,5.4,6.0,9.0,7.7,6.5,7.3,17.2,8.3
求样本中位数,样本 75%分位数,经验分布函数,判定样本实现是否存在奇异点。
(6)已知总体服从泊松分布 ( )P ,求容量为 n 的样本 1
数。
(7)已知 1
X 是取自总体 X 的样本。总体 X 的概率密度函数为
X X
X X
,
,
,
,
n
2
,
X 的样本分布的概率函
,
n
2
1
f
x
( )
x
xe
x
0
0
0
参数是否存在的充分统计量,若存在,请写出一个参数的充分统计量。
(8)已知总体
X N , 1
(0,
X X
~
)
,
2
,
2
X 为取自总体 X 的简单随机杨样本, X 为样本
,
n
均值, 2S 为样本方差。求统计量
2
X
(
n
1)
S
2
,
n
(9)已知 ,X Y 相互独立,且 ~ (0,1)
X N
,
Y
2~
X
2(
n
2
i
3
(10)
应用查表法求 a 的值,写出应用 R 系统求 a 的值的代码。
2
i
X
。若
P
X
)
2
1
的概率分布。
X
/
Y
/10
a
0.95
,
5
R
2
n
,
,
,
X X
X 为取自正态分布总体 (
(10) 已知 1
①求该总体分布关于参数的费希尔信息量 (
②求参数的极大似然估计量 MLE
(11)已知 1
否为最小方差无偏估计量。
(12)已知 1
X 为取自总体 ~
X X
X X
,
,
,
,
,
n
2
2
N 的样本。
,1)
I ;
)
ˆ ,并判定 MLE
ˆ 是否为参数的最小方差无偏估计。
X N 的样本。判定参数的极大似然估计量是
( ,1)
n
,
X N 的样本。考虑检验问题
X 为取自总体 ~
( ,1)
H
2 vs
H
:
0 :
a
,
,
2.6
x x
,
2
。求该检验法犯第
x ,写出由此样本实现估计总体变异系数
统计检验方法:检验统计量取 X ,原假设 0H 的拒绝域为
x
一、二类错误的概率 , ,并讨论当样本量 n 增大时,检验功效1 的变化。
(13)参数估计量选取的均方差准则是什么?在参数估计量选择中如何贯彻均方误差准则?
(14)影响概率密度函数的核估计结果的关键要素有哪些,核密度估计法在实际应用中应如
何应对这些关键要素进行处理?
(15)简述非参数 Bootstrap 估计的基本思想,假定取自总体 X (总体均值记为,总体方差
记为 2 )的样本实现为 1
的 R
运行代码。
(16)简述参数的贝叶斯估计的思想,并指出常用贝叶斯点估计方法。
(17)由样本 1
检验统计量及其 P-Value 的计算式。
(18)有人说“统计假设检验中犯错是不可避免的”,你对这句话是怎么理解的?
(19)如何识别试验数据中是否存在奇异点。
(20)从样本实现探究总体指标概率分布的统计方法有哪些,它们分别适用于什么情况?
3.综合应用题
(1)已知某厂生产的电子元件的有效使用时间T (单位:小时)的概率密度函数为
X 应用 T 检验法检验统计问题 0
H
,写出
v
0
0
vs H
X X
:a
50
/
:
,
,
,
n
2
f
T
t
( )
t
e
1
t
t
0
0
0
2
其中参数 0 。 1
X X
,
,
2
X 为随机抽自该厂生产的部分电子元件的有效使用时间。
,
n
① 求参数的极大似然估计量,并判定该估计量的无偏性。
2
X X
,
,
X 的一个实现为
,
n
② 若样本实现 1
1819.1,2930.8,127.5,2673.8,8785.7,2266.6,542.4,2355.8,1865.1,1259.8
1618.7, 104.9,2104.8,5857.5,2193.5,542.6,1150.1,3517.2,662.3,3429.1
求该厂生产的电子元件的有效使用时间T 大于 2500 小时的概率的极大似然估计值。
(2)总体 X 的均值,方差 2 都存在, 1
,X X 为来自总体 X 的样本,参数的估计量取
1
3
ˆ,
2
ˆ,
3
ˆ
1
1
2
1
2
2
3
3
4
1
4
X
X
X
X
X
X
,
2
1
2
1
2
1
2
2
3
ˆ
ˆ
ˆ
, 中,哪个是最有估计量?
,
1
(3)已知总体 ~
( ,1)
, 1
本。应用单调函数法求参数置信度为1 的置信区间。
X N ,其中未知参数
X X
,
(4)已知总体 X 的概率密度函数为
,
2
X 为取自总体 X 的样
,
n
f x
(
)
x
2 0
2
0
x
其他
2
,
,
X X
1 。 1
其中,参数满足 0
实现。
① 参数先验分布取为
② 求参数的 MAPE。
(5)通过试验获得研究指标 X 的一个样本的实现为
2
( ) 3
(0
1)
X 为取自总体 X 的样本, 1
x x
,
2
,
n
,
x 为样本的一个
,
n
,求参数的后验分布;
55.22 53.12 51.01 47.62 48.51 44.69 50.37 54.70 49.04 43.47
43.28 45.79 43.88 48.48 53.84 48.93 46.17 47.73 45.76 47.12
45.37 48.43 53.97 50.65 50.65 51.40 51.98 47.03 53.66 47.78
基于此样本实现应用 Bootstrap 法,写出求这一研究指标 X 的中位数的估计,及其估计的
标准误的 R 代码。
(6)已知抽自总体 X 样本的样本实现为以下数据:
4.5, 866.7, 643.7, 23.7, 816.0, 611.1, 520.9, 31.1, 183.8, 837.4, 101.5, 50.9, 48.5, 22.2, 673.8,
1678.5, 129.3, 1426.5, 346.1, 2973.3, 375.3, 108.7, 1046.5, 99.4, 369.1, 1637.3, 2.6, 258.5, 693.2,
39.5, 455.5, 16.8, 296.8, 608.4, 410.0, 74.6, 125.2, 189.3, 484.9, 1227.5, 45.9, 1621.7, 328.1,
1761.5, 667.6, 55.9, 68.1, 45.8, 199.5, 24.4, 3028.6, 1102.6, 1053.6, 47.9, 1430.6, 1546.4, 899.2,
210.4, 1017.2, 638.7,1418.8, 681.7, 822.6, 83.3, 820.3, 1378.6, 317.4, 2.2, 1113.9, 1402.6, 851.2,
906.6, 796.6, 148.2, 358.6, 54.0, 489.7, 397.7, 1923.3, 113.4, 1053.5, 799.6, 2571.2, 1677.4,
406.8, 54.8, 699.4, 1954.7, 491.5, 1701.8, 820.5, 423.3, 1091.5, 117.8, 192.7, 448.3, 156.3, 449.9,
143.2, 385.4
取核函数为高斯核。确定总体 X 概率密度估计的最优窗口大小,写出总体 X 概率密度估计
3
P X
的表达式,写出求概率
700
(7)已知总体 X 概率密度安函数为
未知。 1
X X
n X 是枢轴变量;
(
其中参数 (
①证明
)
x
( )
f
,
(1)
②基于枢轴变量
的 R 代码。
x
(
x
)
exp
x
0
X 是来自总体 X 的样本。
,
,
n
2
)
n X 求参数置信度为1 的置信区间。
(
)
(1)
(8)已知总体 X 的概率密度函数为
f
x
( )
x
2 0
0
x
其他
其中未知参数 0 , 1
X X
,
,
2
X 为取自总体 X 的样本。应用单调函数法求参数置信
,
n
度为1 的置信区间。
(9)已知试验指标近似服从分布,现欲在误差不超过 3 个度量单位,可靠性为 95%下估计
该试验指标的总体均值。预备试验的试验次数为 4,样本标准差为 16.5。确能使估计结果能
达到估计要求的最少样本。
(10)某林区发生大面地松毛虫危害,现在发生区内抽样调查了 400 株松树,结果发现有
280 株油松有松毛虫,试以 95% 的可靠性估计该林区松毛虫的发生率。
(11) 某厂生产的高性能的某种型号电池,其寿命的方差长期以来为 2
5000(h )
2
。今
有一批这种电池,从它的生产情况来看,寿命波动性较大,为判断这种想法是否符合实际,
随机抽取了 35 只电池,测得寿命的样本方差为 2
。已知电池寿命服从正态分
7200(h )
2
s
布。在显著性水平
0.01
下,能否判定这批电池的波动性较以往有显著性的变化
H
(12)对于一个总体均值的检验问题 0
,以样本容量为 25 的样
本采用 T 检验法进行检验。已知检验统计量的一个实现 1.94
,自由度为 24 的学生氏 t
分布的分布函数在 1.94 处的函数值为 0.9679,求该检验的 P-Value ,并据此做出检验的结
论。
H
:a
t
0
0
vs
:
(13)从试题库中随机抽取英语单项选择题 400 道,统计发现其正确答案为①的 120 题,为
②的 85 题,为③的 105 题,为④的 90 题。在显著性水平
单项选择题答案①,②,③,④四种答案是等可能的吗?
0.05
下,能够认为试题库中
(14)以研究机构声称全国至少 80%的电视观众对电视剧中间插播商业广告表示厌恶。电视
台随机访问 120 为电视观众,结果有 90 位电视观众赞同研究机构的观点。在显著性水平
下,判定电视台的调查数据是否能否定研究机构的观点。
0.05
(15)某奶品厂有两条同型号的牛奶自动灌装流水线,为了了解两条流水线灌装的牛奶量是
否一致,某日从两条流水线上分别各随机抽取 6 瓶牛奶,测定每瓶灌装的牛奶重量,来自第
一条灌装线的样本实现为 247, 247, 244, 250, 261, 252;来自第二条灌装线的样本实现为
251,242,244,250,259,252。以此样本实现,在显著性水平
下,判定两条灌装生产线
0.05
4
的灌装量是否一致。研究人员应用 R 的分析过程及其获得结论如下:
研究人员的结论为:抽样检测数据表明两条灌装生产线的灌装量是一致的。
依据研究人员分析计算的输出,解答下列问题:
①判定两条灌装生产线的灌装量是否一致的统计假设是什么?
②用于判定两条灌装生产线的灌装量是否一致的统计检验方法是否恰当?如不恰当,你以
为该用什么方法?
5