在熊猫数据框中添加随机噪声和随机 NA

Posted

技术标签:

【中文标题】在熊猫数据框中添加随机噪声和随机 NA【英文标题】:add random noise and random NA in pandas dataframe 【发布时间】:2021-03-14 20:32:02 【问题描述】:

我有一个 pandas 数据框,我想在数据中添加随机 NA 和随机噪声

    exp_TSPAN6  exp_TNMD    exp_DPM1    exp_SCYL3   exp_C1orf112
0   7.951917    3.524705    12.043700   7.605068    8.214067
1   8.079243    9.545859    5.6445321   8.509788    6.853905
2   11.335783   12.45859    12.254986   6.617365    8.196391

示例输出

    exp_TSPAN6  exp_TNMD    exp_DPM1    exp_SCYL3   exp_C1orf112
0   8.951917    4.524705    11.043700   7.605068    8.214067
1   8.079243    NA          NA          8.509788    6.853905
2   11.335783   NA          12.254986   6.617365    9.196391

我已尝试以下代码添加 NA,但无法添加随机噪声

for col in data.columns:
data.loc[data.sample(frac=0.1).index, col] = pd.np.nan

【问题讨论】:

你想添加什么样的随机噪声? @DaniMesejo 随机高斯噪声 【参考方案1】:

你为什么不试试这里的建议:Adding gaussian noise to a dataset of floating points and save it (python)

    将数据加载到 pandas 数据帧 clean_signal = pd.read_csv("data_file_name") 使用 numpy 生成与数据集相同维度的高斯噪声。 使用 signal = clean_signal + noise 为干净信号添加高斯噪声

【讨论】:

以上是关于在熊猫数据框中添加随机噪声和随机 NA的主要内容,如果未能解决你的问题,请参考以下文章

图像处理:随机添加椒盐噪声和高斯噪声Python

如何在 python 中向 Mnist 数据集添加 50% 的随机正常噪声

OpenCV给图像添加噪声

在图像文本文档中随机生成合成噪声

在 CSV 行的每个值中添加随机噪声

白噪声不添加随机字符串