数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)

Posted 文宇肃然

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)相关的知识,希望对你有一定的参考价值。

Python版本

Python-Seaborn 自定义函数绘制

我们可以通过自定义绘图函数的方式在统计图表中添加显著性标注,这里我们直接使用Seaborn自带的iris数据集进行绘制,具体内容如下:

自定义P值和星号对应关系

由于是完全的自定义,这里需要定义一个函数将P值结果和对应星号进行转化,代码如下:

def convert_pvalue_to_asterisks(pvalue):
    if pvalue <= 0.0001:
        return "****"
    elif pvalue <= 0.001:
        return "***"
    elif pvalue <= 0.01:
        return "**"
    elif pvalue <= 0.05:
        return "*"
    return "ns"

scipy.stats 计算显著性指标

由于scipy.stats部分中提供多种显著性检验方法,如T-test、ANOVA等,由于篇幅有限,这里只介绍scipy.stats.ttest_ind() t检验方法,详细结算过程如下:

iris = sns.load_dataset("iris")
data_p = iris[["sepal_length","species"]]
stat,p_value = scipy.stats.ttest_ind(data_p[data_p["species"]=="setosa"]["sepal_length"],
             

以上是关于数据可视化应用数据统计分析的显著性标注(附Python和R语言代码)的主要内容,如果未能解决你的问题,请参考以下文章

R语言基础1:R语言开启数据分析之路(附视频)|暑期系列

基于显著性目标检测的非特定类别图像分割实现以及部署过程(附源码+数据集)

数据可视化应用xarray 绘图可视化-分面绘图(附代码)

【R语言】绘制误差线图+数据分布+显著性分析

R语言 | 差异显著性检验

R语言可视化分面图单变量分组多水平t检验并指定参考水平可视化单变量分组多水平分面箱图(faceting boxplot)并添加显著性水平指定显著性参考水平添加抖动数据点