无偏，一致，MLE · Interview Prep

🧩 一、定义

1️⃣ 无偏（Unbiasedness）

一个估计量 () 对参数 () 是无偏的，如果：

也就是说，在重复抽样的平均意义上，估计值等于真值。

如果 ()，则称其为有偏（biased），偏差为：

👉 关键词：期望等于真值（平均不偏）

2️⃣ 一致（Consistency）

一个估计量 () 随样本量 () 被称为对 () 一致的，如果：

即：

意思是：

当样本越来越多时，估计量越来越接近真值。

👉 关键词：大样本下趋近真值（概率上接近）

📊 二、直观对比

性质	无偏 (Unbiased)	一致 (Consistent)
数学定义	()	()
关注点	期望（平均水平）	收敛（样本量增大）
样本量	有限样本	()
能否保证估计准确	不一定（可能方差大）	能（概率趋近真值）
核心关键词	“平均正确”	“越来越准”

📘 三、二者关系

无偏 ≠ 一致

有可能平均正确，但方差太大，导致随着样本增多并不集中到真值。

例如：

则 ()（无偏），

但 () 随 () 不会集中到 1（不一致）。

一致 ≠ 无偏

很多估计量有限样本有偏，但随着样本量增大偏差消失。

例如：指数分布的 ()：但当 ()，即渐近无偏 → 一致。

🧠 四、直觉理解

类比	无偏	一致
射击比喻	枪打得很散，但平均在靶心上	枪越打越准，集中在靶心
图像
🎯	平均位置对但分布宽 → 无偏不一致
🎯	分布逐渐集中在靶心 → 一致（即使最初有偏）

🧮 五、常见例子

分布	参数	估计量	无偏性	一致性
()	()	()	✅ 无偏	✅ 一致
()	()	()	❌ 有偏	✅ 一致
指数分布	()	()	❌ 有偏	✅ 一致
伯努利分布	(p)	样本均值	✅ 无偏	✅ 一致

🧾 六、两者的形式化联系

若估计量满足以下两个条件：

则：

即：无偏 + 方差趋零 ⇒ 一致。

这其实就是一致性的一个充分条件。

✅ 七、小结记忆法

无偏：平均上对（不系统性偏离真值）一致：样本多了对（越来越接近真值）MLE：有限样本有偏，但大样本一致、渐近无偏。

是否希望我帮你画一张“无偏 vs 一致”对比的图（带靶心和箭点示意，类似统计教材里的射击图）？这在面试或课堂展示时特别直观。

一、指数分布例子：为什么MLE有偏？

设随机样本 ( )，其概率密度函数为

1️⃣ 写出似然函数

取对数：

2️⃣ 对 (\lambda) 求导并令其为零

3️⃣ 计算其期望

已知 () 的分布：若 ( )，则

因此 ()。

于是：

若 ( )，

所以：

✅ 结论：

即 MLE 高估了 真正的 ()，存在正偏差。

随着样本量 ()，偏差 ()，MLE 渐近无偏。

二、为什么MLE一般会有偏？

MLE 是通过最大化似然函数（或对数似然）得到的，它保证的是：

一致性（Consistency）：( )

渐近正态性（Asymptotic normality）

渐近有效性（Asymptotic efficiency）

但 不保证有限样本下无偏。原因是：

非线性变换引入偏差

MLE 常是某个充分统计量的非线性函数，比如 ( )，

而 ()。

Jensen不等式

由于凸性或凹性，()。

比如 ( ) 是凸的 ⇒ ( )。

有限样本的分布不对称

MLE 通常是对对数似然求导的结果，而有限样本下对称性破坏，导致偏差。

三、一般如何判断 MLE 是否有偏？

理论上：

若可以求出 MLE 的期望 ()，直接比较是否等于真值；

若不能显式求解，可以用 Taylor 展开（Bias Approximation）：

其中 () 可由信息矩阵的导数形式给出（Cox–Snell偏差近似公式）：

这里 () 与 log-likelihood 的三阶导数有关。

经验上：

模拟（Monte Carlo）检验：生成大量样本，用MLE估计，取平均值，看是否偏离真值；

若模型中估计量是非线性的充分统计量函数，几乎总是存在偏差；

若估计量是线性的充分统计量函数（如正态分布中 () 的MLE = 样本均值），则无偏。