在熊猫数据框中添加随机噪声和随机 NA
Posted
技术标签:
【中文标题】在熊猫数据框中添加随机噪声和随机 NA【英文标题】:add random noise and random NA in pandas dataframe 【发布时间】:2021-03-14 20:32:02 【问题描述】:我有一个 pandas 数据框,我想在数据中添加随机 NA 和随机噪声
exp_TSPAN6 exp_TNMD exp_DPM1 exp_SCYL3 exp_C1orf112
0 7.951917 3.524705 12.043700 7.605068 8.214067
1 8.079243 9.545859 5.6445321 8.509788 6.853905
2 11.335783 12.45859 12.254986 6.617365 8.196391
示例输出
exp_TSPAN6 exp_TNMD exp_DPM1 exp_SCYL3 exp_C1orf112
0 8.951917 4.524705 11.043700 7.605068 8.214067
1 8.079243 NA NA 8.509788 6.853905
2 11.335783 NA 12.254986 6.617365 9.196391
我已尝试以下代码添加 NA,但无法添加随机噪声
for col in data.columns:
data.loc[data.sample(frac=0.1).index, col] = pd.np.nan
【问题讨论】:
你想添加什么样的随机噪声? @DaniMesejo 随机高斯噪声 【参考方案1】:你为什么不试试这里的建议:Adding gaussian noise to a dataset of floating points and save it (python)
-
将数据加载到 pandas 数据帧 clean_signal = pd.read_csv("data_file_name")
使用 numpy 生成与数据集相同维度的高斯噪声。
使用 signal = clean_signal + noise 为干净信号添加高斯噪声
【讨论】:
以上是关于在熊猫数据框中添加随机噪声和随机 NA的主要内容,如果未能解决你的问题,请参考以下文章