熊猫行的Python p值

Posted

技术标签:

【中文标题】熊猫行的Python p值【英文标题】:Python p value for panda row 【发布时间】:2018-08-10 13:56:12 【问题描述】:

我对 Python 很陌生。我在这里有一个熊猫数据框。它看起来像一个 26 列和 9047943 行的二维矩阵。让我们说:

array([[123,234,345],
       [567,543,342],
       [735,276,697]])

这次我想计算每一行的相关系数和 p 值。即 [123,234,345] 的相关系数和 p 值。然后转到下一行 [567,543,342]。我认为答案应该是这样的T-test in Pandas

我做了很多研究,但我找不到答案。有什么建议吗?非常感谢您的帮助!

【问题讨论】:

Correlation coefficient and p value for each row within a datafarme 的可能重复项,检查一下它会对您有所帮助! 感谢您的帮助。我以前读过这篇文章。但这不是我预期的答案。 pearsonr p 值不是我的预期输出 那么您的预期输出是什么?尝试编辑此帖子并在其中添加更多详细信息 感谢您的回复。问题已更新 【参考方案1】:

可能是这样的。假设您的数据框是 df,并且您的 df 中的所有列都是 int/float:

import numpy as np
df.apply(lambda x: np.corrcoef(x), axis=1)

【讨论】:

感谢您的回复。问题已更新。请阅读。 谢谢。但我的问题是,你想计算 3 个数字的 p 值吗?我相信计算 p 值是为了比较您没有的两个样本。

以上是关于熊猫行的Python p值的主要内容,如果未能解决你的问题,请参考以下文章

无法使用熊猫正确替换空白值

取熊猫系列中每 N 行的总和

熊猫日期列中的不同格式 - 列与行的数据类型

如何在 Python 中读取带有熊猫的 .p 存档文件?

传奇熊猫python中的“无”

比较熊猫数据框中的行值