从数据框中消除字符串以运行时间序列季节性分解

Posted

技术标签:

【中文标题】从数据框中消除字符串以运行时间序列季节性分解【英文标题】:Eliminating string from dataframe to run time series seasonal decomposistion 【发布时间】:2022-01-04 22:55:35 【问题描述】:

我正在尝试在类别列上运行seasonal_decompose。我得到了错误:

ValueError:无法将字符串转换为浮点数:'巧克力:(美国)'

代码:

# Multiplicative Decomposition
decomposeM = seasonal_decompose(df1["Category: All categories"],model='multiplicative', extrapolate_trend='freq')
plt.rcParams['figure.figsize'] = (12, 8);
#decomposeM.plot();
decomposeM.plot().suptitle('Multiplicative Decomposition', fontsize=16)

【问题讨论】:

请提供您的简单数据 【参考方案1】:

pandas 中将列转换为数值非常简单。更改行为的文档可在here 获得。

import pandas as pd
df = pd.DataFrame('col1':[2, 1.2, 'foo', 'bar'])
pd.to_numeric(df.col1, errors='coerce')

输出:

0    2.0
1    1.2
2    NaN
3    NaN
Name: col1, dtype: float64

【讨论】:

以上是关于从数据框中消除字符串以运行时间序列季节性分解的主要内容,如果未能解决你的问题,请参考以下文章

时间序列模型分解,季节调整分析基础

用奇数的起始月份来分解ts

如何解释季节性分解图?

Python使用matplotlib可视化时间序列数据的分解图将时间序列数据进行分解并可视化分解为趋势季节和残差等成分(Time Series Decomposition Plot)

从熊猫数据框中消除特定日期的最快方法

Python数据挖掘-时间序列-非季节性时间学分解