1 t 分布曲线
2 平均值的置信区间
3 显著性检验
4 异常值的取舍
1 t 分布曲线
|
正态分布是无限次测量数据的分布规律,而对有限次测量数据则用
t 分布曲线处理。用 s 代替 ?, 纵坐标仍为概率密度,但横坐标则为统计量 t 。 t 定义为:

|
 |
→ 自由度f — degree of freedom (f = n-1)
t 分布曲线与正态分布曲线相似,只是 t 分布曲线随自由度 f 而改变。当 f 趋近∞时, t 分布就趋近正态分布。
→ 置信度 (P) —confidence degree
在某一t 值时,测定值落在(?+ts)范围内的概率。
→ 置信水平 (?)—confidence level
在某一t 值时,测定值落在 (?+ts) 范围以外的概率 (l -P)
→ ta,f:t 值与置信度 P 及自由度 f 关系。
例:t0.05,10表示置信度为 95% ,自由度为 10 时的 t 值。
t0.01,5表示置信度为 99% ,自由度为 5 时的 t 值。

2 平均值的置信区间 (confidence interval)
→ 当 n 趋近∞时: 单次测量结果

以样本平均值来估计总体平均值可能存在的区间:

→ 对于少量测量数据,即 当 n 有限时 ,必须根据
t 分布进行统计处理:

它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。
例 对其未知试样中 Cl- 的质量分数进行测定, 4 次结果为 47.64% ,
47.69% , 47.52% , 47.55% 。计算置信度为
90% , 95% 和 99% 时,总体平均值 ? 的置信区间。
解:




置信度越高,置信区间就越大,所估计的区间包括真值的可能性也就越大,置信度定在
95% 或 90% 。
3 显著性检验 — Significance test
(1) F 检验法 — F test
比较两组数据的方差
s2
(2) t 检验法 — t test
* 平均值与标准值的比较
* 两组平均值的比较
(1) F 检验法
→ 比较两组数据的方差 s2 , 以确定它们的精密度是否有显著性差异的方法。统计量
F 定义为两组数据的方差的比值,分子为大的方差,分母为小的方差。

→ 两组数据的精密度相差不大,则 F 值趋近于 1 ;若两者之间存在显著性差异, F 值就较大。
→ 在一定的 P(置信度 95%) 及 f 时, F 计算 > F表 ,存在显著性差异,否则,不存在显著性差异。

判断两组数据的精密度是否有显著性差异时,一组数据的精密度可能大于,等于,或小于另一组数据的精密度,显著性水平为单侧检验时的两倍,即
0.10 ,此时的置信 P =1 - 0.10=0.90(90%) 。
例 1 在吸光光度分析中,用一台旧仪器测定溶液的吸光度
6 次,得标准偏差 s 1 =0.055; 再用一台性能稍好的新仪器测定
4 次,得标准偏差 s2 =0.022 。 试问新仪器的精密度是否显著地优于旧仪器的精密度
?
解 已知新仪器的性能较好,它的精密度不会比旧仪器的差,因此,这是属于单边检验问题。
已知 n1 =6 , s1 =0.055
n2 =4 , s2 =0.022
查表, f大 =6-1=5 , f小=4-1=3 , F表 =9.01 , F<F表,故两种仪器的精密度之间不存在显著性差异,即不能做出新仪器显著地优于旧仪器的结论。做出这种判断的可靠性达
95% 。
例 2 采用两种不同的方法分析某种试样,用第一种方法分析
11 次,得标准偏差 s1 =0.21% ; 用第二种方法分析 9 次,得标准偏差
s2 =0.60% 。 试判断两种分析方法的精密度之间是否有显著性差异
?
解 不论是第一种方法的精密度显著地优于或劣于第二种方法的精密度,都认为它们之间有显著性差异,因此,这是属于双边检验问题。
已知 n1 = 11, s1 = 0.21%
n2 = 9, s2 = 0.60%
查表, f大 =9 -1=8 , f小 =11 - 1=10 , F表 =3.07 , F>F 表 ,故认为两种方法的精密度之间存在显著性差异。作出此种判断的置信度为
90% 。
(2) t 检验法
→ 平均值与标准值的比较
为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析,再利用
t 检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。
进行 t 检验时,首先按下式计算出 t 值
若 t计算 > ta,f, 存在显著性差异,否则不存在显著性差异。
通常以 95% 的置信度为检验标准,即显著性水准为
5% 。
例 采用某种新方法测定基准明矾中铝的质量分数,得到下列
9 个分析结果: 10.74% , 10.77% , 10.77%
, 10.77% , 10.81% , 10.82% , 10.73% ,
10.86% , 10.81% 。已知明矾中铝含量的标准值
(以理论值代) 为 10.77% 。试问采用该新方法后,是否引起系统误差
(置信度 95%)?
解
n =9, f =9-1=8 

查表 , P =0.95, f =8 时, t 0.05 , 8 =2.31 。 t<t0.05,8 , 故 x 与 ? 之间不存在显著性差异,即采用新方法后,没有引起明显的系统误差
。
→ 两组平均值的比较
设两组分析数据为:
n1 s1 x1
n2 s2 x2

在一定置信度时,查出表值 (总自由度 f=n1 + n2 - 2) , 若 t>t表 两组平均值存在显著性差异。 t<t表 ,则不存在显著性差异。
例 用两种方法测定合金中铝的质量分数,所得结果如下:
第一法 1.26% 1.25% 1.22%
第二法 1.35% 1.31% 1.33%
试问两种方法之间是否有显著性差异
(置信度 90%)?
解 n1 = 3, x1 = 1.24% s1 = 0.021%
n2 = 4, x2 = 1.33% s2 = 0.017%
f大 =2 f小 =3 F表 =9.55 F<F表

→ 说明两组数据的标准偏差没有显著性差异.


→当 P =0.90 , f = n1 + n2 -2 = 5 时, t0.10,5 = 2.02 。 t> t0.10,5, 故两种分析方法之间存在显著性差异.
4 异常值(cutlier) 的取舍
在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。
处理方法有 4d 法、格鲁布斯 (Grubbs) 法和
Q 检验法。
(1) 4d 法
? 根据正态分布规律,偏差超过 3? 的个别测定值的概率小于
0.3% ,故这一测量值通常可以舍去。而 ? = 0.80?,3?≈
4?, 即偏差超过 4? 的个别测定值可以舍去。
? 用 4d 法判断异常值的取舍时,首先求出除异常值外的其余数据的平均值和平均偏差
d , 然后将异常值与平均值进行比较,如绝对差值大于
4d , 则将可疑值舍去,否则保留。
? 当 4d 法与其他检验法矛盾时,以其他法则为准。
例 测定某药物中钴的含量如 (?g/g), 得结果如下:
1.25 , 1.27 , 1.31 , 1.40 。试问 1.40
这个数据是否应保留 ?
解 首先不计异常值 1.40 ,求得其余数据的平均值
x 和平均偏差
d 为

异常值与平均值的差的绝对值为
|1.40 - 1.28| = 0.12 > 4d(0.092)
故 1.40 这一数据应舍去。
(2)格鲁布斯 (Grubbs) 法
有一组数据,从小到大排列为:
x1 ,x2 ,……,xn-1 ,xn
其中 x1或 xn可能是异常值。
用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量
T 进行判断。

若 T>Ta,n,则异常值应舍去,否则应保留

例 前一例中的实验数据,用格鲁布斯法判断时,
1.40 这个数据应保留否 (置信度 95%)?
解 平均值 x = 1.31 ,
s = 0.066
查表 T0.05,4 =1.46 , T<T0.05,4, 故 1.40 这个数据应该保留。
格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数
x 及 s , 故方法的准确性较好。缺点是需要计算
x 和 s, 手续稍麻烦。
(3) Q 检验法
设一组数据,从小到大排列为 :
x1 ,x2 ,……,xn-1 ,xn
设 x1、 xn为异常值,则统计量 Q 为:

式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。
Q 值越大,说明 x n 离群越远。 Q 称为 “ 舍弃商 ” 。当 Q计算 > Q 表时,异常值应舍去,否则应予保留。
