由于“未知标签类型'连续'”,逻辑回归不起作用?
Posted
技术标签:
【中文标题】由于“未知标签类型\'连续\'”,逻辑回归不起作用?【英文标题】:Logistic Regression not working because of "unknown label type 'continuous'"?由于“未知标签类型'连续'”,逻辑回归不起作用? 【发布时间】:2021-09-23 10:00:59 【问题描述】:我正在尝试使用 Sklearn 实现逻辑回归。目前我有一个数据框,它由 12 个输入变量和 1 个输出变量组成。
输出数据帧是二进制值,而其余 12 个变量不一定如此。
输入数据的结构示例。
#PseudoCode (Y and X are pandas dataframes)
Y = 0, 1, 0, 1, 1, 1 # Output data
X = A1: 1, 1, 2, 1, 2, 2 #Input Data
B2: 45, 23, 12, 56, 23, 86
...
L12: 4.2, 3.2, 1.2, 2.3, 2.3, 9.9
接下来就完成了:
X = X.astype(int) # to make sure that the data is actually in int format.
Y = Y.astype(int)
X_train, X_test, y_train, y_test = train_test_split(X,Y,test_size=.10, random_state = 42)
xscaler = StandardScaler()
yscaler = StandardScaler()
pipe = Pipeline([('scaler', xscaler), ('logit', LogisticRegression())])
model = TransformedTargetRegressor(regressor=pipe, transformer=yscaler)
model.fit(X_train,y_train)
然而,这会抛出以下内容:
ValueError: Unknown label type: 'continuous'
即使Y
数据显然是二进制值,为什么会发生这种情况?
【问题讨论】:
可能是this 【参考方案1】:这里的问题是您正在使用StandardScaler()
缩放标签y
。
y
是一个分类变量,用于表示样本属于 1
或 0
类,因此不得对其进行缩放。
【讨论】:
以上是关于由于“未知标签类型'连续'”,逻辑回归不起作用?的主要内容,如果未能解决你的问题,请参考以下文章
当我将 IterativeImputer 与 KNeighborsClassifier 一起使用时出现错误“未知标签类型:'连续'”
将 PermutationImportance 与 LGBMClassifier 一起使用会导致 ValueError:未知标签类型:“连续”