Pandas 返回:ValueError: Unknown label type: 'continuous'

Posted

技术标签:

【中文标题】Pandas 返回:ValueError: Unknown label type: \'continuous\'【英文标题】:Pandas returns this: ValueError: Unknown label type: 'continuous'Pandas 返回:ValueError: Unknown label type: 'continuous' 【发布时间】:2021-01-21 04:10:28 【问题描述】:

我在使用 pandas 和 sklearn 进行机器学习时遇到了问题。我的问题是

ValueError:未知标签类型:'连续'

我试过了

model = sklearn.tree.DecisionTreeClassifier()
model.fit(X, y)

它返回此错误:

ValueError                                Traceback (most recent call last)
<ipython-input-45-3caead2f350b> in <module>
----> 1 model.fit(ninp, out)

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\tree\_classes.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
    888         """
    889 
--> 890         super().fit(
    891             X, y,
    892             sample_weight=sample_weight,

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\tree\_classes.py in fit(self, X, y, sample_weight, check_input, X_idx_sorted)
    179 
    180         if is_classification:
--> 181             check_classification_targets(y)
    182             y = np.copy(y)
    183 

c:\users\user\appdata\local\programs\python\python38-32\lib\site-packages\sklearn\utils\multiclass.py in check_classification_targets(y)
    170     if y_type not in ['binary', 'multiclass', 'multiclass-multioutput',
    171                       'multilabel-indicator', 'multilabel-sequences']:
--> 172         raise ValueError("Unknown label type: %r" % y_type)
    173 
    174 

ValueError: Unknown label type: 'continuous'

【问题讨论】:

现在知道Xy 包含什么内容可能会有所帮助?也许添加一个简短的例子来帮助理解它们的结构。 这能回答你的问题吗? LogisticRegression: Unknown label type: 'continuous' using sklearn in python 你需要检查你的目标是什么,很可能它是浮动的。在这种情况下,您可能会考虑切换到回归或检查在类似情况下已经在 SO 上给出的其他众多答案。 【参考方案1】:

分类器将一组示例分类为离散的类(即,它分配与 K 个类中的一个对应的标签)。如果您的目标(y 变量的内容)是连续的(例如介于 0 和 1 之间的浮点数),则决策树不知道如何处理它。

您有 2 个解决方案:

    您的问题是分类任务,您需要对目标变量进行建模,使其代表类别而不是连续变量 您的问题不是分类任务,它是回归任务,您需要使用适当的模型(例如DecisionTreeRegressor

【讨论】:

以上是关于Pandas 返回:ValueError: Unknown label type: 'continuous'的主要内容,如果未能解决你的问题,请参考以下文章

pandas.apply expand column ValueError: If using all scalar values, you must pass a index

pandas apply返回多列时出错ValueError: Must have equal len keys and value when setting with an iterable解决方案

pandas apply返回多列时出错ValueError: Must have equal len keys and value when setting with an iterable解决方案

Pandas:ValueError:无法将浮点 NaN 转换为整数

Pandas - ValueError:无法从重复的轴重新索引

Pandas 应用返回两个新列的函数