跳转至

统计量的充分性

定义

若样本关于统计量的条件分布与假设的总体分布族的参数\(\theta\)无关,则称此统计量为充分统计量。

理解

统计量的充分性是一个蛮有意思的定义,一个统计量是充分的意味着它包含了该分布参数的全部信息。

这里,我们举一个简单的例子来理解这一定义。

取二项分布\(b(10,p)\),先设统计量\(T(X)=\sum{x_i}\)为目标统计量。

或许可以很轻易的发现,当我们确定\(T(X)\)的值之后,比如我们知道它的值是5,那么样本的分布只有\(C_{10}^{5}\)种,而且根据二项分布的定义,单个样本点的取值互相之间是独立的,故每一种可能的可能性都相等,这时我们发现样本的分布完全与该二项分布的参数\(p\)无关,所以我们把这种情况称为该统计量关于该参数\(p\)是充分的,也即它涵盖了参数的所有信息,导致在该统计量的已知性的约束下该分布完全与参数\(p\)无关了。

因子化定理

设样本的分布密度为\(\mathscr{P}^{\mathrm{X}}=\left\{p_{\theta}(x), \theta \in \Theta\right\}, p_{\theta}(x)\),如果\(p_{\theta}(x)\)可以写做

\(p_{\theta}(x)=g_{\theta}(T(x)) h(x), \theta \in \Theta\)

其中\(h(x)\)为与\(\theta\)无关的非负函数,则\(T(x)\)为充分统计量。