数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)相关的知识,希望对你有一定的参考价值。
Python版本
Python-Seaborn 自定义函数绘制
我们可以通过自定义绘图函数的方式在统计图表中添加显著性标注,这里我们直接使用Seaborn自带的iris数据集进行绘制,具体内容如下:
自定义P值和星号对应关系
由于是完全的自定义,这里需要定义一个函数将P值结果和对应星号进行转化,代码如下:
def convert_pvalue_to_asterisks(pvalue):
if pvalue <= 0.0001:
return "****"
elif pvalue <= 0.001:
return "***"
elif pvalue <= 0.01:
return "**"
elif pvalue <= 0.05:
return "*"
return "ns"
scipy.stats 计算显著性指标
由于scipy.stats部分中提供多种显著性检验方法,如T-test、ANOVA等,由于篇幅有限,这里只介绍scipy.stats.ttest_ind() t检验方法,详细结算过程如下:
iris = sns.load_dataset("iris")
data_p = iris[["sepal_length","species"]]
stat,p_value = scipy.stats.ttest_ind(data_p[data_p["species"]=="setosa"]["sepal_length"],
以上是关于数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)的主要内容,如果未能解决你的问题,请参考以下文章
基于显著性目标检测的非特定类别图像分割实现以及部署过程(附源码+数据集)
R语言可视化分面图单变量分组多水平t检验并指定参考水平可视化单变量分组多水平分面箱图(faceting boxplot)并添加显著性水平指定显著性参考水平添加抖动数据点