如何获得预测值和测试数据,并可视化实际与预测?

Posted

技术标签:

【中文标题】如何获得预测值和测试数据,并可视化实际与预测?【英文标题】:How to get predicted values along with test data, and visualize actual vs predicted? 【发布时间】:2020-01-18 14:04:02 【问题描述】:
from sklearn import datasets
import numpy as np
import pandas as pd from sklearn.model_selection
import train_test_split
from sklearn.linear_model import Perceptron

data = pd.read_csv('student_selection.csv')

x = data[['Average','Pass','Division','Domicile']]
y = data[['Selected']]

x_train,x_test,y_train,y_test train_test_split(x,y,test_size=1,random_state=0)

ppn = Perceptron(eta0=1.0, fit_intercept=True, max_iter=1000, n_iter_no_change=5, random_state=0)

ppn.fit(x_train, y_train)

y_pred = ppn.predict(x_train)

x_train['Predicted'] = pd.Series(y_pred)

如何以表格和图表的形式查看实际与预测? x_train 是我得到的预测值,但我无法将其与实际数据合并以查看偏差。

【问题讨论】:

【参考方案1】:

如何以表格和图表的形式查看实际与预测的对比?

只要运行:

y_predict= pnn.predict(x)

data['y_predict'] = y_predict

并在您的数据框中拥有该列,如果您想绘制它,您可以使用:

import matplotlib.pyplot as plt
plt.scatter(data['Selected'], data['y_predict'])
plt.show()

【讨论】:

以上是关于如何获得预测值和测试数据,并可视化实际与预测?的主要内容,如果未能解决你的问题,请参考以下文章

R语言plotly可视化:可视化回归模型实际值和回归预测值的散点图分析回归模型的预测效能区分训练集和测试集一个好的模型大部分的散点在对角线附近添加边缘直方图以快速诊断模型可能存在的任何预测偏差

R语言e1071包中的支持向量机:仿真数据(螺旋线性不可分数据集)简单线性核的支持向量机SVM(模型在测试集上的表现可视化模型预测的结果添加超平面区域与原始数据标签进行对比分析)如何改进核函数

如何在 R 中绘制回归树的预测值与实际值? [关闭]

如何使用 LSTM Keras 预测未来库存

随机森林在训练和测试中获得 98% 的准确率,但总是预测相同的类别

LSTM模型预测sin函数详解