跳转至

泊松过程

泊松过程

泊松分布的推导

二项分布描述了有限个服从01分布的随机变量加和的分布,并不注重这些事件“发生”的时间节点或顺序。而泊松分布将二项分布推广至连续的时间域上,也即在一段连续的时间上每一刻都有一个与之对应的满足01分布的随机变量。此外,泊松分布限制了单位时间上事件发生数量的均值,所以满足01分布的随机变量的事件发生概率会随事件数量变化,故而当 \(\lambda\) 增大时,此过程中的 “二项分布” 的参数p也会随着变化。

由以上定义,我们对泊松分布的密度函数进行简单的推导:

二项分布的密度函数可以写为:\(\frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}\)

由于泊松分布限制了单位时间段上的事件发生均值,为了不让其趋于正无穷,我们将这里的 \(p\) 换为 \(\frac{\lambda}{n}\)

于是我们有泊松密度函数:

\[ \begin{aligned} \frac{n}{k !(n-k) !}\left(\frac{\lambda}{n}\right)^{k}\left(1-\frac{\lambda}{n}\right)^{n-k}&=\frac{n \cdot(n-1) \cdots(n-k+1)}{n^{k}} \frac{\lambda^{k}}{k !} \frac{\left(1-\frac{\lambda}{n}\right)^{n}}{\left(1-\frac{\lambda}{n}\right)^{k}}\\ &=\prod_{i=1}^{k}\left(1-\frac{i-1}{n}\right) \cdot\left(1-\frac{\lambda}{n}\right)^{-k} \cdot \frac{\lambda^{k}}{k !}\left(1-\frac{\lambda}{n}\right)^{n}\\ &\overset{{n \rightarrow \infty}}{=} \frac{\lambda^{k}}{k !} e^{-\lambda} \end{aligned} \]

由此我们得到了当二项分布的实验次数为无限次,但每次实验中,事件发生的概率与实验次数成反比的概率模型。这并非就是我们想要的泊松分布的密度函数,但是它确切地描述了一种性质:当实验次数趋于无穷,而每次实验时事件发生的概率随实验次数减小时,二项分布的密度函数具有一种带有特定参数的指数性质,而这个参数恰好就是n次实验后事件发生次数的期望,满足了泊松分布对于单位时间段上事件发生次数一定的要求。

这时候人们通过大量计算,发现很多统计事件都满足上述密度函数调整参数 \(\lambda\) 后的分布,然后这个函数又可以被二项分布的连续情况导出,人们拍脑袋一想,我就说这玩意它满足泊松分布你也不能把我怎么地不是,起个名罢了。于是泊松分布便应运而生了。(纯属构想,并非史实)

顺带一提,有的人想统计连续的时间段上 \([0,T]\) 时间内满足泊松分布的随机变量的密度函数,但又不知道如何计算,根据上述推导,我们其实可以随便指定所谓单位时间的长度,毕竟都是实数系上的有长度的区间,谁包含的时刻数量还不是个无穷了?根据二项分布事件发生的独立性,一段连续时间上发生的事件的数量应该与时间长度成正比,所以对于一般给出的 \(\lambda\) ,我们通常直接将其换为 \(\lambda t\) 来表示时间长度为 \(t\) 的01分布随机变量的加和的分布是什么样的。此外,由此可以看出强度为 \(\lambda\) 的泊松过程的单位时间随机变量与强度为 \(\frac{\lambda}n\) 但时间长度为 n 的随机变量同分布。于是,我们可以将满足不同强度的泊松分布的随机变量看作为不同长度的时间段上统计的随机变量,如果将两个随机变量的加和的分布看作是同一泊松分布强度中不同时间长度的加和的分布,泊松过程的可加性便也就一目了然了。

定义

泊松过程是指在一段连续的时间内,每一时刻都等可能地来到一次呼叫的计数过程。用教材上的话说,其满足平稳增量性和独立增量性。(其实就是对应上述推导中的单位时间期望一定和事件互相独立)

在泊松过程中,我们常用一些符号来便捷地描述它:

\[ N(t): 截止时刻t时到来的呼叫数量,其满足泊松分布\quad N(t) \sim \epsilon(\lambda)\\ S_n: 第n次到来呼叫时经过的时间,其满足伽马分布\quad S_n \sim \Gamma(\alpha, \lambda)\\ X_n: 从第n-1次呼叫到第n次呼叫经过的时间,其满足指数分布\quad X_n \sim \operatorname{Exp}(\beta)\\ \]