🧩 一、定义
1️⃣ 无偏(Unbiasedness)
一个估计量 () 对参数 () 是无偏的,如果:
也就是说,在重复抽样的平均意义上,估计值等于真值。
如果 (),则称其为有偏(biased),偏差为:
👉 关键词:期望等于真值(平均不偏)
2️⃣ 一致(Consistency)
一个估计量 () 随样本量 () 被称为对 () 一致的,如果:
即:
意思是:
当样本越来越多时,估计量越来越接近真值。
👉 关键词:大样本下趋近真值(概率上接近)
📊 二、直观对比
性质 | 无偏 (Unbiased) | 一致 (Consistent) |
数学定义 | () | () |
关注点 | 期望(平均水平) | 收敛(样本量增大) |
样本量 | 有限样本 | () |
能否保证估计准确 | 不一定(可能方差大) | 能(概率趋近真值) |
核心关键词 | “平均正确” | “越来越准” |
📘 三、二者关系
- 无偏 ≠ 一致
有可能平均正确,但方差太大,导致随着样本增多并不集中到真值。
例如:
则 ()(无偏),
但 () 随 () 不会集中到 1(不一致)。
- 一致 ≠ 无偏
很多估计量有限样本有偏,但随着样本量增大偏差消失。
例如:指数分布的 ():
但当 (),
即渐近无偏 → 一致。
🧠 四、直觉理解
类比 | 无偏 | 一致 |
射击比喻 | 枪打得很散,但平均在靶心上 | 枪越打越准,集中在靶心 |
图像 | ||
🎯 | 平均位置对但分布宽 → 无偏不一致 | |
🎯 | 分布逐渐集中在靶心 → 一致(即使最初有偏) |
🧮 五、常见例子
分布 | 参数 | 估计量 | 无偏性 | 一致性 |
() | () | () | ✅ 无偏 | ✅ 一致 |
() | () | () | ❌ 有偏 | ✅ 一致 |
指数分布 | () | () | ❌ 有偏 | ✅ 一致 |
伯努利分布 | (p) | 样本均值 | ✅ 无偏 | ✅ 一致 |
🧾 六、两者的形式化联系
若估计量满足以下两个条件:
则:
即:无偏 + 方差趋零 ⇒ 一致。
这其实就是一致性的一个充分条件。
✅ 七、小结记忆法
无偏:平均上对(不系统性偏离真值)一致:样本多了对(越来越接近真值)MLE:有限样本有偏,但大样本一致、渐近无偏。
是否希望我帮你画一张“无偏 vs 一致”对比的图(带靶心和箭点示意,类似统计教材里的射击图)?这在面试或课堂展示时特别直观。
一、指数分布例子:为什么MLE有偏?
设随机样本 ( ),其概率密度函数为
1️⃣ 写出似然函数
取对数:
2️⃣ 对 (\lambda) 求导并令其为零
3️⃣ 计算其期望
已知 () 的分布:若 ( ),则
因此 ()。
于是:
若 ( ),
所以:
✅ 结论:
即 MLE 高估了 真正的 (),存在正偏差。
随着样本量 (),偏差 (),MLE 渐近无偏。
二、为什么MLE一般会有偏?
MLE 是通过最大化似然函数(或对数似然)得到的,它保证的是:
- 一致性(Consistency):( )
- 渐近正态性(Asymptotic normality)
- 渐近有效性(Asymptotic efficiency)
但 不保证有限样本下无偏。原因是:
- 非线性变换引入偏差
- MLE 常是某个充分统计量的非线性函数,比如 ( ),
而 ()。
- Jensen不等式
- 由于凸性或凹性,()。
比如 ( ) 是凸的 ⇒ ( )。
- 有限样本的分布不对称
- MLE 通常是对对数似然求导的结果,而有限样本下对称性破坏,导致偏差。
三、一般如何判断 MLE 是否有偏?
理论上:
- 若可以求出 MLE 的期望 (),直接比较是否等于真值;
- 若不能显式求解,可以用 Taylor 展开(Bias Approximation):
其中 () 可由信息矩阵的导数形式给出(Cox–Snell偏差近似公式):
这里 () 与 log-likelihood 的三阶导数有关。
经验上:
- 模拟(Monte Carlo)检验:生成大量样本,用MLE估计,取平均值,看是否偏离真值;
- 若模型中估计量是非线性的充分统计量函数,几乎总是存在偏差;
- 若估计量是线性的充分统计量函数(如正态分布中 () 的MLE = 样本均值),则无偏。
