Python气象数据处理与绘图(2):常用数据计算方法
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python气象数据处理与绘图(2):常用数据计算方法相关的知识,希望对你有一定的参考价值。
参考技术A 对于气象绘图来讲,第一步是对数据的处理,通过各类公式,或者统计方法将原始数据处理为目标数据。按照气象统计课程的内容,我给出了一些常用到的统计方法的对应函数:
在计算气候态,区域平均时均要使用到求均值函数,对应NCL中的dim_average函数,在python中通常使用np.mean()函数
numpy.mean(a, axis, dtype)
假设a为[time,lat,lon]的数据,那么
需要特别注意的是,气象数据中常有缺测,在NCL中,使用求均值函数会自动略过,而在python中,当任意一数与缺测(np.nan)计算的结果均为np.nan,比如求[1,2,3,4,np.nan]的平均值,结果为np.nan
因此,当数据存在缺测数据时,通常使用np.nanmean()函数,用法同上,此时[1,2,3,4,np.nan]的平均值为(1+2+3+4)/4 = 2.5
同样的,求某数组最大最小值时也有np.nanmax(), np.nanmin()函数来补充np.max(), np.min()的不足。
其他很多np的计算函数也可以通过在前边加‘nan’来使用。
另外,
也可以直接将a中缺失值全部填充为0。
np.std(a, axis, dtype)
用法同np.mean()
在NCL中有直接求数据标准化的函数dim_standardize()
其实也就是一行的事,根据需要指定维度即可。
皮尔逊相关系数:
相关可以说是气象科研中最常用的方法之一了,numpy函数中的np.corrcoef(x, y)就可以实现相关计算。但是在这里我推荐scipy.stats中的函数来计算相关系数:
这个函数缺点和有点都很明显,优点是可以直接返回相关系数R及其P值,这避免了我们进一步计算置信度。而缺点则是该函数只支持两个一维数组的计算,也就是说当我们需要计算一个场和一个序列的相关时,我们需要循环来实现。
其中a[time,lat,lon],b[time]
(NCL中为regcoef()函数)
同样推荐Scipy库中的stats.linregress(x,y)函数:
slop: 回归斜率
intercept:回归截距
r_value: 相关系数
p_value: P值
std_err: 估计标准误差
直接可以输出P值,同样省去了做置信度检验的过程,遗憾的是仍需同相关系数一样循环计算。
数据可视化应用气象绘图(附Python代码)
数据
本文使用数据来自:https://psl.noaa.gov/data/gridded/data.ncep.reanalysis.derived.surface.html
北半球冬季平均经向风
难点:各种库的下载与安装,主要难点在xarray上。
因为不需要设置地图,此图还是比较简单的。结果和代码如下。
fig4.2
import matplotlib.pyplot as plt
import xarray as xr
import numpy as np
import matplotlib.ticker as ticker
dir_loc = r"D:\\meteo_data\\ncar\\vwnd.mon.mean.nc"
def DrawVWind():
# 读取数据
vwind = xr.open_dataset(dir_loc)["vwnd"]
# 选择使用的年份
year_label = (vwind[\'time\'].dt.year >= 1990) & (vwind[\'time\'].dt.year <= 2019)
# 选择年份做季节平均
vwindM = vwind[year_label].groupby("time.season").mean(dim="time")
# 选择DJF,做 纬向平均
vwindM2 = vwindM.loc[dict(season="DJF")].mean("lon")
以上是关于Python气象数据处理与绘图(2):常用数据计算方法的主要内容,如果未能解决你的问题,请参考以下文章
Python气象数据处理与绘图(12):轨迹(台风路径,寒潮路径,水汽轨迹)绘制