MASS

您所在的位置：网站首页 › 二项分布的密度函数公式是什么 › MASS

MASS

2024-07-05 09:55| 来源: 网络整理| 查看: 265

本篇是“广义线性模型”系列推文的最后一篇，来介绍另外一种重要的广义线性模型：负二项回归。

同泊松回归一样，负二项回归也是计数模型。由于泊松回归的内在要求是因变量的数学期望和方差相等，而当数据序列出现“过度离散”（方差比理论值大）时，可有两种方式进行模型修正：

使用准泊松分布族；

改用负二项回归。

前者已经介绍过了，本篇来介绍后者——负二项回归。

模型形式

负二项回归的模型形式与泊松回归十分相似。

泊松回归：

负二项回归：

泊松分布与负二项分布有着内在的联系。当泊松分布的参数不再是一个确定的数值，而是服从伽马分布进行变化时，此时的分布形式称为伽马-泊松混合分布，负二项分布是伽马-泊松混合分布的特例。

《Modern Applied Statistics with S-PLUS》[1]上有关于负二项分布与泊松分布关系的描述：

负二项分布的方差恒大于数学期望，并受参数的影响。从模型形式上看，负二项回归比泊松回归多了一个随机项：

为伽马分布的记号。

负二项分布

泊松分布的概率函数如下：

伽马分布的概率密度函数如下：

为形状参数，为逆尺度参数。数学期望，方差。

伽马-泊松混合分布的概率密度函数如下：

负二项分布的概率函数如下：

对比伽马-泊松混合分布和负二项分布的概率（密度）函数，令，，则二者相等。

负二项分布的意义：随机事件刚好第次发生（不发生）时所经历的不发生（发生）的次数。

模型的R代码

负二项回归虽然属于广义线性模型，但在stats工具包中并没有定义负二项分布族函数。

MASS工具包的glm.nb函数可以进行负二项回归，并自动确定参数的取值。

glm.nb(formula, data, weights, subset, na.action, start = NULL, etastart, mustart, control = glm.control(...), method = "glm.fit", model = TRUE, x = FALSE, y = TRUE, contrasts = NULL, ..., init.theta, link = log)

MASS工具包的名称即上面提到的《Modern Applied Statistics with S-PLUS》的首字母缩写；

glm.nb函数专门用于负二项回归，因此无需family参数。

library(MASS) model.nb |z|) ## (Intercept) 2.89458 0.22842 12.672

【本文地址】

MASS

MASS

今日新闻

推荐新闻