如何使用 R 中“ivprobit”包中的“ivprobit”功能?

Posted

技术标签:

【中文标题】如何使用 R 中“ivprobit”包中的“ivprobit”功能?【英文标题】:How can I use the "ivprobit" function in "ivprobit" package in R? 【发布时间】:2019-07-15 08:06:52 【问题描述】:

我正在尝试理解 R 中“ivprobit”包中“ivprobit”函数的语法。指令说:

 Usage
 ivprobit(formula, data)

 Arguments
    formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.    
            exogenous variables,y1 is the r.h.s. endogenous variables and 
            x2 is the complete set of instruments
    data    the dataframe

然后显示对应的例子:

 data(eco)

 pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)

 summary(pro)

如果我符合指令的解释,

 y= d2 = dichotomous l.h.s.
 x= ltass+roe+div = the r.h.s. exogenous variables
 y1= eqrat+bonus = the r.h.s. endogenous variables
 x2= tass+roe+div+gap+cfa = the complete set of instruments

我不明白 x 和 x2 之间的区别。 此外,如果 x2 是完整的工具集,为什么它不包括内生变量 y1 呢?相反,它还包括“gap”和“cfa”变量,这些变量甚至都没有显示在 x(外生变量)甚至 y 中。

假设我选择的工具变量确实是“eqrat”和“bonus”,我如何构建知道 x(外生变量)和 x2(完整的工具集)之间的差异?

【问题讨论】:

【参考方案1】:

请注意,这里我们讨论的是 sintax,而不是模型的“优点”,对于此类问题,您应该参考 https://stats.stackexchange.com/。

我们以这个等式为例:。

正如正确指出的那样, 在等式中不是真的,这只是一个示例。

这里:

是因变量;

是“有问题”的内生变量(一个或多个);

是没有“问题”的外生变量(一个或多个); 是“帮助”内生变量的工具(一个或多个);

为什么内生有问题?因为它们与错误 相关,这会导致经典 OLS 估计出现问题。

是工具,因为它们具有一些基本属性(更多 here):

独立于误差项; 不影响 给定 保持不变; 与相关。

在建议的sintax中,我们有:

x,外生,对应(没问题); y1,内生,对应(有问题); x2,全套仪器,对应。

在您引用的示例中,x2x 共享一些公共变量,这是一组外生变量(没有问题),加上另外两个工具。

该模型使用 3 个外生变量作为工具,再加上另外两个变量。

我不明白 x 和 x2 的区别

x2 是工具,可能会或可能不会与一组外生变量 (x) 重叠。

如果 x2 是完整的工具集,为什么它不包括内生变量 y1?

不得包括内生变量,因为这些是方程需要使用工具处理的变量。


一个例子:

您想要构建一个模型,希望预测双亲家庭中的女性是否有工作。你有这些变量:

fem_works,响应或因变量; fem_edu,女性受教育程度,外生; kids,夫妻子女数,外生; other_income,家庭收入,内生(你知道这是先验知识); male_edu,人的学历,乐器(这个你选)。

使用ivprobit,这将是:

mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)

other_income 对模型有问题,因为您怀疑它与误差项相关(其他冲击可能同时影响fem_worksother_income),您决定使用male_edu 作为工具,在为了“缓解”这个问题。 (示例取自here)

【讨论】:

是的 Z 不在等式中,我同意,我应该改写那部分。而且我同意文档不清楚,我只是按照示例回答了 OP 的问题,这是与 sintax 相关的。我的回答更关心 OP 要求对 sintax 进行更多解释,而不是 probit 模型。 或者即使是好的instrument,这些问题甚至不适合这个网站。当然,感谢您指出一些不准确之处。 但即使在语法上这也不正确:如果工具变量是male_edu,那么完整的工具集是fem_edu + kids + male_edu。事实上,如果您尝试 ivprobit 使用文档中的示例(或任何任意示例),如果您不写出全套仪器,模型将不会运行。 我的错误,感谢您指出这一点,我稍后添加了该部分,我没有检查上面的示例。 我认为,如果您仔细阅读此处报告的示例 (stata.com/manuals13/rivprobit.pdf),您可以在输出中找到一些说明。您没有获得该乐器的 coef 似乎很正常。 STATA 显示了一个关于仪器“优点”的测试(Wald 测试)。

以上是关于如何使用 R 中“ivprobit”包中的“ivprobit”功能?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 R 包中正确使用其他包中的函数

scipy.integrate.solve_ivp 中的初始值

如何使用 R 中 gplot() 包中的 plotmean() 函数使用 paste0() 操作 n.label 值以获得观察次数

如何运行使用旧版本包和最新 R 版本和包中的 R 编写的 R 脚本? [关闭]

如何将数据集放入 R 包中

如何在 r 汽车包中的后续情节的完整性中以适当的格式在 x 轴上绘制日期?