【单章】统计学进阶：蒙特卡罗模拟

您所在的位置：网站首页 › 均匀分布的概率分布期望和方差的区别 › 【单章】统计学进阶：蒙特卡罗模拟

【单章】统计学进阶：蒙特卡罗模拟

2023-04-19 03:30| 来源: 网络整理| 查看: 265

本文与蒙特卡罗算法（Monte Carlo Algorithm）和蒙特卡洛方法的大型介绍（例如优化、数值积分、从概率分布生成绘图、模拟、蒙特卡洛树搜索等）暂时无关。后续如果考虑扩充本章，会加入。

01 基础概念：分布（同回归分析大章）

对分布和概率本身感兴趣的朋友可以阅读概率论、基础概念大章内我写的一小部分内容，或是未发布的贝叶斯数据分析大章。

无论是贝叶斯学派还是频率学派，分布，或是概率分布 distribution 都是我们需要牢记的一个概念。简单地说，某个变量的分布的狭义概念指的是该变量的概率分布函数/积累分布函数（CDF）。也就意味着该变量的总体遵循某个特定的概率分布形状。得益于中心极限定理，我们，也就是所有社科朋友最常见的连续分布是正态分布。许多概念我们先验地假定其是正态分布的，在我们的研究道路上，起到了许多方便简洁，但全然错误的作用。

然而，（连续变量的）概率密度函数PDF/（离散变量的）概率质量函数PMF在我们的研究中更为常见。下面将列举一些常见的分布。

连续分布分布大类/形状（大概分一下）正式名称参数常见用法备注均匀分布连续均匀（uniform）分布a（最小值），b（最大值）--正态分布大类/形状一元高斯分布/正态（Gaussian/Normal）分布数学期望μ（位置参数）, 标准差σ（尺度参数）根据中心极限定理，可用于描述分布未知的实值随机变量。钟形曲线。是自由度v为无限的学生-t分布正态分布大类/形状多元正态分布均值向量μ，方差-协方差矩阵∑-根据维度而定的钟形形状正态分布大类/形状标准一元正态分布-z分数/z分布（错称）/t分数（日语：偏差值）期望为0，标准差为1正态分布大类/抽样分布学生t-（Student's t-）分布v（df，自由度）仅适用于统计方法中。半重尾分布。广义双曲分布的特殊情况。（不是tau分布）正态分布大类/形状对数正态（Log/Log-normal）分布数学期望μ（位置参数）, 标准差σ（尺度参数）如某个分布是正态分布，则它的对数服从对数正态分布。统计检验方法分布/抽样分布（中心）F-分布d1, d2（df，自由度）仅适用于统计方法中。-统计检验方法/机器学习方法分布逻辑（Logistic）分布μ（位置参数）, s（尺度参数）仅适用于统计方法/机器学习中。类似正态分布，但属于肥尾/长尾分布。统计检验方法分布/抽样分布/伽马分布大类卡方分布k（df，自由度）仅适用于统计方法中。隶属于伽马分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。伽马分布大类/形状伽马（γ）分布k（形状参数），θ（逆尺度参数）或α，β（基本一致，k=α，β与θ可以互转）大量真实案例的分布，跨多个学科。例如收入（劳工市场的薪酬）、生产力、生命长度等。许多似然分布（例如泊松分布、指数分布、已知均值的正态分布、帕累托分布和已知σ的伽玛/逆伽玛）的共轭先验分布。伽马分布大类/形状指数（Exponential ）分布/负指数分布α = 1可用于独立随机事件发生的时间间隔。适用于泊松事件流的等待时间。其他常用柯西（-洛伦兹）分布x0（位置参数），γ（尺度参数）-肥尾/长尾分布。概率密度函数无限延伸，因此没有期望与标准差。易与正态分布弄混。其称呼洛伦兹分布与洛伦兹曲线没有半毛钱关系。其他常用标准柯西分布--位置参数为0，尺度参数为1。自由度v为1的学生t-分布其他常用贝塔（β/B）分布α，β（均为形状参数）可用于概率建模。值域在0与1之间，因此，适合作为伯努利分布和二项式分布的共轭先验分布。其他常用狄利克雷分布/多元Beta分布K（类别数），α（浓度参数）-贝塔分布在高维/多元时的情况。适合作为多元正态分布、分类分布和多项分布的的共轭先验分布。其他常用拉普拉斯分布/双指数分布μ（位置参数），b（尺度参数）--其他常用帕累托分布/布拉德福分布xm，k大量真实案例的分布，跨多个学科。例如，财富在个人之间的分配就属于帕累托分布。常用于经济学中。其他常用tau分布-可用于残差统计贝塔分布的特例。用于误差独立且正态分布情况下，学生化残差的概率分布。

厚/肥尾 fat tail、重尾 heavy tail、长尾 long tail 分布/问题 [1]

重尾/轻尾 heavy/light tailed distribution

被称为 X 的kurtosis，中文翻译为峰度，但这一翻译并不准确，想了解更多可跳转https://riscap.wordpress.com/2020/04/26/%e4%b8%ba%e4%bb%80%e4%b9%88kurtosis%e4%b8%8d%e6%98%af%e5%b3%b0%e5%ba%a6%ef%bc%9f/。根据kurtosis值的大小可以将概率分布分为如下三种情况。如果 \kappa=3 ，称为常态峰 mesokurtic。这种情况最重要的例子是正态分布（normal distribution）。如果 \kappa>3 ，称为尖峰态 leptokurtic。相比于正态分布，此类分布有更重的尾部。T分布是最常见的leptokurtic分布之一。如果 \kappa

【本文地址】

【单章】统计学进阶：蒙特卡罗模拟

【单章】统计学进阶：蒙特卡罗模拟

今日新闻

推荐新闻