发现样本数量不一致的输入变量:Python 中的 [23038, 7680]
Posted
技术标签:
【中文标题】发现样本数量不一致的输入变量:Python 中的 [23038, 7680]【英文标题】:Found input variables with inconsistent numbers of samples: [23038, 7680] in Python 【发布时间】:2018-10-03 21:07:01 【问题描述】:我尝试运行以下代码:
from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors =5, metric = 'minkowski', p = 2 )
classifier.fit(X_train, y_test)
我得到的错误是:
from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors =5, metric = 'minkowski', p = 2 )
classifier.fit(X_train, y_test)
Traceback (most recent call last):
File "<ipython-input-47-60c527e5ec72>", line 3, in <module>
classifier.fit(X_train, y_test)
File "C:\Users\rahul\Anaconda3\lib\site-packages\sklearn\neighbors\base.py", line 765, in fit
X, y = check_X_y(X, y, "csr", multi_output=True)
File "C:\Users\rahul\Anaconda3\lib\site-packages\sklearn\utils\validation.py", line 583, in check_X_y
check_consistent_length(X, y)
File "C:\Users\rahul\Anaconda3\lib\site-pac kages\sklearn\utils\validation.py", line 204, in check_consistent_length
" samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [23038, 7680]
有人知道我该怎么办吗?
谢谢。
【问题讨论】:
【参考方案1】:您正在使用错误的标签(即测试标签)拟合训练测试。请使用训练标签
from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors =5, metric = 'minkowski', p = 2 )
classifier.fit(X_train, y_train)
classifier.predict(X_test)
【讨论】:
以上是关于发现样本数量不一致的输入变量:Python 中的 [23038, 7680]的主要内容,如果未能解决你的问题,请参考以下文章
如何解决 Python 中的“ValueError:找到样本数量不一致的输入变量”问题
ValueError:发现样本数量不一致的输入变量:[143, 426]