测量系统的偏倚
题库中有涉及到偏倚的题目,说将一个500克的砝码,放在台秤上去称重,测量20次,结果发现均值为510克,问偏倚是否合格。但是,教材中并没有明确偏倚的好坏判定标准,故作此文,供大家参考。
一.偏倚的概念
所谓偏倚,就是测量平均值与真值的差,书中178,181页有关于偏倚的介绍。其示意图如图一所示。
图一:偏倚示意图
二.如何判断偏倚的好坏
我曾经看过一个BBC纪录片《一根绳子有多长》,讲述了为了测量一根绳子的真实长度,从学校到研究所的过程。
以目前的技术手段来看,偏倚肯定是存在的,那么我们如何确定偏倚是否可以接受呢?
我们用以下思路解决该问题。
图二:六西格玛解决问题的过程
首先,实际问题是,测量系统的偏倚是否可以接受。如何将该问题变为统计问题?
从偏倚的定义来看,理想状态下,测量值=真值,那就意味着:
真值-测试值=0
也就是说偏倚为零。
这里说的0,并未每次测量值与真值完全一致,绝对为0 的概念,而是偏倚是一个以0为中心的正态分布。
因此转换为统计问题就是,偏倚是否为0.
即H0:偏倚=0 VS H1:偏倚≠0
这里我们需要想象一个以0为均值的正态分布(H0),图中黑色实线,以及一个均值不为0的正态分布(H1),图中红色虚线。
图三:偏倚是否为0的假设分布情况
书上P181页的例子,其实也是这个思路。
理论铺垫到此为此,我们来实践一下,我们引用《MSA第三版》中的一个例子来看,对一个标准值为6克的砝码进行15次测量,结果如下,问偏倚是否能接受。
测试值 |
5.8 |
5.7 |
5.9 |
5.9 |
6 |
6.1 |
6 |
6.1 |
6.4 |
6.3 |
6 |
6.1 |
6.2 |
5.6 |
6 |
按照偏倚的公式,我们用真实值-测试值,得到偏倚量如下:
偏倚 |
0.2 |
0.3 |
0.1 |
0.1 |
0 |
-0.1 |
0 |
-0.1 |
-0.4 |
-0.3 |
0 |
-0.1 |
-0.2 |
0.4 |
0 |
现在的问题就是偏倚量的分布,服从以0为中心的正态分布吗?我们要做的是比较一组样本(均值)与目标(0)是否相等,偏倚的总体标准差未知,根据下图选择的工具为单样本t检验。
图四:假设检验工具选择
检验结果如下:
单样本 T: 偏倚 mu = 0 与 ≠ 0 的检验 变量 N 均值 标准差 均值标准误 95%
置信区间
T
P 偏倚 15 -0.0067 0.2120 0.0547 (-0.1241, 0.1107) -0.12 0.905 |
检验结果给出了偏倚的均值为-0.0067,标准差为0.2120,置信区间为(-0.1241, 0.1107),置信区间包括0,也就是说偏倚的服从均值为零的分布,从P值也能看出,不能拒绝H0,这里计算的置信区间与《MSA第三版》计算的稍有差异,是由于小数点选择等方面的误差,不影响我们的判断。在这样的情况下,将统计结论转化为实际结论,我们认为该偏倚是可以接受的。
三、另一个偏倚的例子
一名工厂领班选择了五个代表预期测量值范围的部件。每个部件都通过高级的仪器检查测量以确定其真值。然后,一名操作员将每个部件随机测量了十二次。过程变异为16.5368,问该偏倚和线性是否可以接受。
说明:在第一个例子中,我们只测试了一个标准值6克,因此只能估算偏倚,而这个例子,测量了五个不同位置的标准值,因此可以同时估计线性(仪器测量能力范围内, Accuracy 或Precision 值的差异,也可理解为不同真值附近的偏倚,P182页,此处不展开论述)。
我们采用电脑分析结论如下(有时会考到下图的解读):
图五:偏倚和线性研究
整体偏倚值为-0.05333,整体偏倚P值0.04,小于0.05,说明过程存在偏倚,且不等于0。
平均值下面说明了对不同真值的样品偏倚的情况,对2和10这两个值得样本,偏倚特别大。而对4和6这两个值偏倚很小(对应的P大于0.05,说明在该真值点,偏倚为0),%偏倚代表偏倚占过程变异的比例,大约0.3%。
线性2.177735和线性百分率13.2%说明了在测量范围内,测量的偏倚值波动保持在2.177735范围内。根据量具线性系数,可以得出偏倚的回归方程为:
y(偏倚)=0.73667-0.13167x(x为图中参考值)
由于常量和斜率的p值都为零,说明该测量系统存在线性偏倚的问题。(反之P大于0,则不存在线性偏倚问题。)
R-Sq=71.4%也说明了存在问题,根据回归的结论,x的变化会引起y的变化,即不同位置的测量值,会造成偏倚的变化,这也是我们不希望发生的,这一点正好与回归分析中我们希望看到x的变化引起y的变化不一致。因此,在偏倚和线性研究中,我们希望看到R-Sq值小一点,即x的变化不影响偏倚的变化。
另一个判断是否存在线性偏倚的方法是,观察偏倚值为0的这根横线,是否包含在回归直线的置信区间内,我们这个案例中,偏倚值为0的这根横线,与置信带交叉而不是被包含其中。
总结:关于如何判断偏倚和线性的好坏,书中没有明确的结论,应该还是根据企业实际情况来做决定。例如我家的温度计不准,不同的温度计测试结果完全不同,但条件限制,买不起太贵的温度计,只好作罢。
这里给出一个经验值,偏倚要小于10%以内。线性的定义其实与偏倚有关(不同测量值的偏倚),最好也能小于10%(当然有些行业可能要求更高),总之越小越好。

如果您觉得本文不错,请分享给好友