ctree CART 条件树中的权重与权重 (party::ctree)

Posted

技术标签:

【中文标题】ctree CART 条件树中的权重与权重 (party::ctree)【英文标题】:Weights vs weights in ctree CART conditional tree (party::ctree) 【发布时间】:2021-07-20 01:56:47 【问题描述】:

条件购物车中的“权重”和“权重”是什么?

我正在使用 CARTS 通过递归分区来分析一个小型数据集 (N=70)。具体来说,ctree函数在R中形成了party包。

我对什么是“权重”和“权重”有点困惑。据我了解,他们将每个节点的最终观察次数称为“权重”。但是,也可以将“权重”设置为具有条件树的模型中的重要性度量,我称之为“统计权重”。

我将一个分类变量设置为“统计权重”,我不确定软件在后面做什么,但是每个节点的样本量(N="weights")突然变大了 5.5 倍(N=400)比最初的,总样本大小(N = n1+n2+n3..))取决于最小桶和最大深度。我认为该模型只会考虑此类变量的可重复性并在模型中对其进行权衡。我理解为什么节点的样本大小会有所不同,但我没想到总 N 会发生变化。

我已经多次阅读 patry 手册,还尝试了 partykit 包。我反复阅读,这些概念可能得到了解释,但在推理树中添加“统计权重”时,我对获得如此大的样本量(“权重”)感到困惑。

【问题讨论】:

【参考方案1】:

折腾了好久,终于发现有人在这里问了同样的问题: https://stats.stackexchange.com/questions/178993/defintion-of-the-terms-node-weight-and-case-weight

【讨论】:

以上是关于ctree CART 条件树中的权重与权重 (party::ctree)的主要内容,如果未能解决你的问题,请参考以下文章

带权重的 Ctree 分类 - 显示结果

将树中的权重从叶子更新到根时出错

hdf5 文件中的权重和偏差

Prim算法详解

如何将一个观察值与先前的观察值相乘,但仅当某个条件为真时

自动编码器的解码器权重与 Keras 中的权重绑定