R语言广义线性模型泊松回归（Poisson Regression）模型

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了R语言广义线性模型泊松回归（Poisson Regression）模型相关的知识，希望对你有一定的参考价值。

试想一下，你现在就站在一个人流密集的马路旁，打算收集闯红灯的人群情况（？）。首先，利用秒表和计数器，一分钟过去了，有5个人闯红灯；第二分钟有4个人；而下一分钟有4个人。持续记录下去，你就可以得到一个模型，这便是“泊松分布”的原型。

对因变量是离散型变量的问题建模时，普通的线性回归模型、定序回归模型和逻辑回归模型已经能解决我们大部分的需求。但有一类特殊的因变量记录某个特定事件出现的次数（有序的非负整数），它们被称之为“计数数据”。如果我们按照普通的线性回归模型建模：

虽然等号两边都是具有数值意义的实数，但是等号右边可以是任意连续值，但是等号左边只能是非负实数（计数数据）。因此普通的线性回归模型是无法对计数数据建模的。

Poisson模型(泊松回归模型)是用于描述单位时间、单位面积或者单位容积内某事件发现的频数分布情况，通常用于描述稀有事件（即小概率）事件发生数的分布。

上述例子中都明显的一个特点：低概率性，以及单位时间(或面积、体积)内的数量。通常情况下，满足以下三个条件时，可认为数据满足Poisson分布：

(1) 平稳性：发生频数的大小，只与单位大小有关系（比如1万为单位，或者100万为单位时患癌症人数不同）；

(2) 独立

以上是关于R语言广义线性模型泊松回归（Poisson Regression）模型的主要内容，如果未能解决你的问题，请参考以下文章