跳转至

统计量

定义

统计量就是样本的函数。

通常,我们把样本以一种规则映射到数上,即某个样本代表1,某个样本代表2,然后你突然想求个均值,这个均值\(\sum{\bar x}\)即为所谓的统计量,当然统计量还有很多种,比如分位点,经验分布函数这种长相比较奇奇怪怪的统计量。

矩形统计量

原点矩

\[ E(X^k) \]

中心矩

\[ E{[X-E(X)]^k} \]

个人觉得,原点矩可以直接理解为随机变量的k次方的均值,而中心矩就是做了一个变换,转而关心变量关于其中心的变化情况。 不知道为啥要取个“矩”的名字,可能是为了看起来牛逼吧。 所以,均值和方差都是矩。矩型统计量涵盖了数理统计领域中的绝大多数统计量,或者是统计量的基本单元,这种方法利于计算,也容易结合线性代数等知识求解,所以以用广泛。

顺序统计量

按照鄙人的理解,顺序统计量其实就是把样本排个序, 然后就没了。 然后根据样本的排序结果来得到一些有意思的东西,比如中位数,分位点,分位矩,极差,经验分布函数,盒形图等。

至于排序规则,按照书上的定义是从小到大排序,不过我觉得其它的排序规则得到的序列也能被称为顺序统计量。

其它常用统计量

众数

表示样本中出现最多的那个值。

样本相关系数

\[ r=r(x, y)=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}} \]

计算两列样本之间的相关性,对于样本列的线性变换不敏感。