【单章】统计学进阶:蒙特卡罗模拟

您所在的位置:网站首页 均匀分布的概率分布期望和方差的区别 【单章】统计学进阶:蒙特卡罗模拟

【单章】统计学进阶:蒙特卡罗模拟

2023-04-19 03:30| 来源: 网络整理| 查看: 265

本文与蒙特卡罗算法(Monte Carlo Algorithm)和蒙特卡洛方法的大型介绍(例如优化、数值积分、从概率分布生成绘图、模拟、蒙特卡洛树搜索等)暂时无关。后续如果考虑扩充本章,会加入。

01 基础概念:分布(同回归分析大章)

对分布和概率本身感兴趣的朋友可以阅读概率论、基础概念大章内我写的一小部分内容,或是未发布的贝叶斯数据分析大章。

无论是贝叶斯学派还是频率学派,分布,或是概率分布 distribution 都是我们需要牢记的一个概念。简单地说,某个变量的分布的狭义概念指的是该变量的概率分布函数/积累分布函数(CDF)。也就意味着该变量的总体遵循某个特定的概率分布形状。得益于中心极限定理,我们,也就是所有社科朋友最常见的连续分布是正态分布。许多概念我们先验地假定其是正态分布的,在我们的研究道路上,起到了许多方便简洁,但全然错误的作用。

然而,(连续变量的)概率密度函数PDF/(离散变量的)概率质量函数PMF在我们的研究中更为常见。下面将列举一些常见的分布。

连续分布分布大类/形状(大概分一下)正式名称参数常见用法备注均匀分布连续均匀(uniform)分布a(最小值),b(最大值)--正态分布大类/形状一元高斯分布/正态(Gaussian/Normal)分布数学期望μ(位置参数), 标准差σ(尺度参数)根据中心极限定理,可用于描述分布未知的实值随机变量。钟形曲线。是自由度v为无限的学生-t分布正态分布大类/形状多元正态分布均值向量μ,方差-协方差矩阵∑-根据维度而定的钟形形状正态分布大类/形状标准一元正态分布-z分数/z分布(错称)/t分数(日语:偏差值)期望为0,标准差为1正态分布大类/抽样分布学生t-(Student's t-)分布v(df,自由度)仅适用于统计方法中。半重尾分布。广义双曲分布的特殊情况。(不是tau分布)正态分布大类/形状对数正态(Log/Log-normal)分布数学期望μ(位置参数), 标准差σ(尺度参数)如某个分布是正态分布,则它的对数服从对数正态分布。统计检验方法分布/抽样分布(中心)F-分布d1, d2(df,自由度)仅适用于统计方法中。-统计检验方法/机器学习方法分布逻辑(Logistic)分布μ(位置参数), s(尺度参数)仅适用于统计方法/机器学习中。类似正态分布,但属于肥尾/长尾分布。统计检验方法分布/抽样分布/伽马分布大类卡方分布k(df,自由度)仅适用于统计方法中。隶属于伽马分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。伽马分布大类/形状伽马(γ)分布k(形状参数),θ(逆尺度参数)或α,β(基本一致,k=α,β与θ可以互转)大量真实案例的分布,跨多个学科。例如收入(劳工市场的薪酬)、生产力、生命长度等。许多似然分布(例如泊松分布、指数分布、已知均值的正态分布、帕累托分布和已知σ的伽玛/逆伽玛)的共轭先验分布。伽马分布大类/形状指数(Exponential )分布/负指数分布α = 1可用于独立随机事件发生的时间间隔。适用于泊松事件流的等待时间。其他常用柯西(-洛伦兹)分布x0(位置参数),γ(尺度参数)-肥尾/长尾分布。概率密度函数无限延伸,因此没有期望与标准差。易与正态分布弄混。其称呼洛伦兹分布与洛伦兹曲线没有半毛钱关系。其他常用标准柯西分布--位置参数为0,尺度参数为1。自由度v为1的学生t-分布其他常用贝塔(β/B)分布α,β(均为形状参数)可用于概率建模。值域在0与1之间,因此,适合作为伯努利分布和二项式分布的共轭先验分布。其他常用狄利克雷分布/多元Beta分布K(类别数),α(浓度参数)-贝塔分布在高维/多元时的情况。适合作为多元正态分布、分类分布和多项分布的的共轭先验分布。其他常用拉普拉斯分布/双指数分布μ(位置参数),b(尺度参数)--其他常用帕累托分布/布拉德福分布xm,k大量真实案例的分布,跨多个学科。例如,财富在个人之间的分配就属于帕累托分布。常用于经济学中。其他常用tau分布-可用于残差统计贝塔分布的特例。用于误差独立且正态分布情况下,学生化残差的概率分布。

厚/肥尾 fat tail、重尾 heavy tail、长尾 long tail 分布/问题 [1]

重尾/轻尾 heavy/light tailed distribution

被称为 X 的kurtosis,中文翻译为峰度,但这一翻译并不准确,想了解更多可跳转https://riscap.wordpress.com/2020/04/26/%e4%b8%ba%e4%bb%80%e4%b9%88kurtosis%e4%b8%8d%e6%98%af%e5%b3%b0%e5%ba%a6%ef%bc%9f/。根据kurtosis值的大小可以将概率分布分为如下三种情况。 如果 \kappa=3 ,称为常态峰 mesokurtic。这种情况最重要的例子是正态分布(normal distribution)。 如果 \kappa>3 ,称为尖峰态 leptokurtic。相比于正态分布,此类分布有更重的尾部。T分布是最常见的leptokurtic分布之一。 如果 \kappa


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3