使用聚类数据进行 Sklearn 回归

Posted

技术标签:

【中文标题】使用聚类数据进行 Sklearn 回归【英文标题】:Sklearn regression with clustered data 【发布时间】:2020-12-28 04:22:08 【问题描述】:

我正在尝试使用集群数据集在sklearn 中运行多项式LogisticRegression(也就是说,每个个体有多个观察值,其中只有一些特征发生变化,而其他特征保持不变)。

我知道statsmodels 可以通过以下方式解决这个问题:

mnl = MNLogit(x,y).fit(cov_type="cluster", cov_kwds="groups": cluster_groups)

有没有办法用 sklearn 包来复制它?

【问题讨论】:

您是在寻找聚类数据集上的多类(多项)逻辑回归还是逻辑回归? 我知道如何在 sklearn 中运行多项式 logit,我想了解如何在集群数据集上运行一项。 你能放一个你的数据集的例子和更多的代码而不是一行吗? 【参考方案1】:

为了在sklearn中运行多项Logistic回归,可以使用LogisticRegression模块,然后将参数multi_class设置为multinomial

参考:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

【讨论】:

我知道如何在 sklearn 中运行多项式 logit,我想了解如何在集群数据集上运行多项式 logit,您知道是否可以在 sklearn 中完成?

以上是关于使用聚类数据进行 Sklearn 回归的主要内容,如果未能解决你的问题,请参考以下文章

sklearn数据库-老鱼学sklearn

python sklearn库实现逻辑回归的实例代码

Sklearn机器学习基础(day02基础入门篇)

sklearn使用小贴士

如何使用 Sklearn Kmeans 对稀疏数据进行聚类

[AI] sklearn 库的基本功能 & 内置数据