皮尔森相关性系数的计算python代码
Posted 时光-ing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了皮尔森相关性系数的计算python代码相关的知识,希望对你有一定的参考价值。
import os
import pandas as pd
import numpy as np
from scipy.stats import pearsonr
def Pearson(data):
selected = []
for i in range(len(data.columns) - 1):
coor, p = pearsonr(list(data.iloc[:, i]), list(data.iloc[:, -1]))
if p < 0.05 or len(selected) < 0.8 * (len(data.columns) - 1):
selected.append(data.columns[i])
print("0与Result的corr为: 1".format(data.columns[i], coor))
if __name__ == "__main__":
path = os.path.join(os.getcwd(), 'XXX.xls')
# 读取数据
data = pd.read_excel(path, skiprows=0)
data.head()
X = np.array(data.iloc[:, :-1])
y = np.array(data.iloc[:, -1:])
# 3. 皮尔逊分析
remaining = Pearson(data)
data = data.loc[:, remaining + ['Result']]
print(data.head())
以上是关于皮尔森相关性系数的计算python代码的主要内容,如果未能解决你的问题,请参考以下文章