转摘【基础理论】介绍一个概率分布:柯西分布

度绍元阅读量 371

目录

一、提要

二、柯西分布的几何解释

三、性质

四、结论



一、提要

连续概率密度函数究竟有多少,应该有无穷多。在诸多分布函数中,高斯分布可能是最著名的。然而,有没有类似于高斯函数的分布,而形式上不是指数函数的呢?回答是有,柯西分布就是一种。

二、柯西分布的几何解释

柯西分布,也称为柯西-洛伦兹分布或洛伦兹分布,是描述共振行为的连续分布。它还描述了以随机角度倾斜的线段切割 x 轴的水平距离分布。如图:我们从原点引出射线,相邻射线角度相等,这些射线与平行于x轴的直线S有交点,这些交点在S线上的密度是不同的,显然,在90°的附近密度最大。(目测)

![](https://img-blog.csdnimg.cn/18d60a55ad9946bc83f367fd88054da3.png)

[Cauchy Distribution -- from Wolfram MathWorld](https://mathworld.wolfram.com/CauchyDistribution.html "Cauchy Distribution -- from Wolfram MathWorld")

让 θ 表示具有固定旋转点的线与垂直轴所成的角度,如图所示。然后

![](https://img-blog.csdnimg.cn/e71ac0da06814f14a6e6542ad02bb5b5.png)

![tan\Theta = \frac{x}{b}](https://latex.csdn.net/eq?tan\Theta = \frac{x}{b}) (1)

![\Theta = tan^{-1} \frac{x}{b}](https://latex.csdn.net/eq?\Theta = tan^{-1} \frac{x}{b}) (2)

![d\Theta = \frac{1}{1+\frac{x2}{b2}}\frac{dx}{b} =\frac{bdx}{b2+x2}](https://latex.csdn.net/eq?d\Theta = \frac{1}{1+\frac{x^2}{b^2}}\frac{dx}{b} =\frac{bdx}{b^2+x^2}) (3)

![\frac{d\theta }{\pi } =\frac{1}{ \pi } \frac{bdx}{b2+x2}](https://latex.csdn.net/eq?\frac{d\theta }{\pi } =\frac{1}{ \pi } \frac{bdx}{b^2+x^2}) (4)

将(4)分别取积分:

![](https://img-blog.csdnimg.cn/aa634909d0804f7bbb6a7e5327d4dc0f.png)

显然,左边是对![\[-\frac{\pi}{2},\frac{\pi}{2}]](https://latex.csdn.net/eq?\[-\frac{\pi}{2},\frac{\pi}{2}])上均匀分布积分,后者是对某个函数在整个数轴积分,两个都是1;显然都能构成概率密度函数。(注意概率密度函数的三个要素)


后者的概率密度函数就是柯西分布。即:

![f(x) = \frac{1}{ \pi } \frac{b }{b2+x2}](https://latex.csdn.net/eq?f(x) = \frac{1}{ \pi } \frac{b }{b^2+x^2})

更一般的写法是:

![](https://img-blog.csdnimg.cn/45eb7946c7e744829c464cf25e81bc3e.png)

密度函数和分布函数的曲线:

![](https://img-blog.csdnimg.cn/aa4b5407ec8d4dd08df587ac36ff183b.png)


其中 b 是半峰半宽,m 是统计中位数。在关于的图示中,m=0。Cauchy 分布在 Wolfram 语言中实现为 CauchyDistribution[m, Gamma/2].

三、性质

柯西分布的均值、方差都不存在!。下面我们使用[numpy](https://so.csdn.net/so/search?q=numpy&spm=1001.2101.3001.7020 "numpy")对它进行抽样,并和标准正态分布进行对照。

python 复制代码
import numpy as np
from matplotlib import pyplot as plt
cnt=1000 #抽样1000个样本点
x=np.random.standard_cauchy(cnt)
y=np.random.randn(cnt)
plt.figure()
plt.subplot(2,1,1)
plt.hist(x,100,density=True)
plt.legend(['Cauchy'])

plt.subplot(2,1,2)
plt.hist(y,100,density=True)
plt.legend(['Gauss'])
plt.show()

结果图:

![](https://img-blog.csdnimg.cn/eac2ce20c72b4b08a5103996608e73d3.png)


![](https://img-blog.csdnimg.cn/96b5e829303f43c2a4c68fa465ba38f1.png)

四、结论

柯西分布的取值范围非常广,很大的值也有一定概率取到,因而柯西分布也称为heavy-tail distribution。并且相比于gaussian,概率密度的最大取值只有0.1,就是x=0的那个地方。

而高斯分布的取值就集中很多,0处的概率密度为0.6左右。

再有,在量子世界,粒子和粒子距离很远,比如,电子到原子核的距离,就好比一个汽车到三千公里外的一个城市距离,因此,要显著描述电子的位置分布,只能是柯西-洛伦兹分布,不能用高斯分布刻画,因为高斯分布尺度不够,信号太弱,噪声将把电子的电磁能量淹没,模型无效。

复制代码
    ===========================
    【来源: CSDN】
    【作者: 无水先生】
    【原文链接】 https://yamagota.blog.csdn.net/article/details/126877539
    声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。
0/300
全部评论0
0/300