熊猫行的Python p值
Posted
技术标签:
【中文标题】熊猫行的Python p值【英文标题】:Python p value for panda row 【发布时间】:2018-08-10 13:56:12 【问题描述】:我对 Python 很陌生。我在这里有一个熊猫数据框。它看起来像一个 26 列和 9047943 行的二维矩阵。让我们说:
array([[123,234,345],
[567,543,342],
[735,276,697]])
这次我想计算每一行的相关系数和 p 值。即 [123,234,345] 的相关系数和 p 值。然后转到下一行 [567,543,342]。我认为答案应该是这样的T-test in Pandas
我做了很多研究,但我找不到答案。有什么建议吗?非常感谢您的帮助!
【问题讨论】:
Correlation coefficient and p value for each row within a datafarme 的可能重复项,检查一下它会对您有所帮助! 感谢您的帮助。我以前读过这篇文章。但这不是我预期的答案。 pearsonr p 值不是我的预期输出 那么您的预期输出是什么?尝试编辑此帖子并在其中添加更多详细信息 感谢您的回复。问题已更新 【参考方案1】:可能是这样的。假设您的数据框是 df,并且您的 df 中的所有列都是 int/float:
import numpy as np
df.apply(lambda x: np.corrcoef(x), axis=1)
【讨论】:
感谢您的回复。问题已更新。请阅读。 谢谢。但我的问题是,你想计算 3 个数字的 p 值吗?我相信计算 p 值是为了比较您没有的两个样本。以上是关于熊猫行的Python p值的主要内容,如果未能解决你的问题,请参考以下文章