Pandas `read_json` 函数将字符串转换为 DateTime 对象,即使指定了 `convert_dates=False` 属性

Posted

技术标签:

【中文标题】Pandas `read_json` 函数将字符串转换为 DateTime 对象,即使指定了 `convert_dates=False` 属性【英文标题】:Pandas `read_json` function converts strings to DateTime objects even the `convert_dates=False` attr is specified 【发布时间】:2017-02-04 19:55:01 【问题描述】:

我有下一个 JSON:

[
"2016-08": 1355,
"2016-09": 2799,
"2016-10": 2432,
"2016-11": 0
, 
"2016-08": 1475,
"2016-09": 1968,
"2016-10": 1375,
"2016-11": 0
, 
"2016-08": 3097,
"2016-09": 1244,
"2016-10": 2339,
"2016-11": 0
, 
"2016-08": 1305,
"2016-09": 1625,
"2016-10": 3038,
"2016-11": 0
, 
"2016-08": 1530,
"2016-09": 4385,
"2016-10": 2369,
"2016-11": 0
, 
"2016-08": 3515,
"2016-09": 4532,
"2016-10": 2497,
"2016-11": 0
, 
"2016-08": 1539,
"2016-09": 1276,
"2016-10": 4378,
"2016-11": 0
, 
"2016-08": 4989,
"2016-09": 3143,
"2016-10": 2075,
"2016-11": 0
, 
"2016-08": 3357,
"2016-09": 2745,
"2016-10": 1592,
"2016-11": 0
, 
"2016-08": 3224,
"2016-09": 2694,
"2016-10": 3958,
"2016-11": 0
]

当我调用pandas.read_json(JSON, convert_dates=False) 时,我得到下一个结果:

如您所见,所有列都已自动转换。我用错了什么?

我一直在使用 python3.5 和 pandas 0.18.1

【问题讨论】:

【参考方案1】:

read_json中需要参数convert_axes=False

df = pd.read_json('file.json', convert_axes=False)
print (df)
   2016-08  2016-09  2016-10  2016-11
0     1355     2799     2432        0
1     1475     1968     1375        0
2     3097     1244     2339        0
3     1305     1625     3038        0
4     1530     4385     2369        0
5     3515     4532     2497        0
6     1539     1276     4378        0
7     4989     3143     2075        0
8     3357     2745     1592        0
9     3224     2694     3958        0

convert_dates=False 在值未转换为 indexcolumns 时有效:

[
    "2016-08": "2016-08",
    "2016-09": 2799,
    "2016-10": 2432,
    "2016-11": 0
, 
    "2016-08": 1475,
    "2016-09": 1968,
    "2016-10": 1375,
    "2016-11": 0
,
...
...

#1355 changed to '2016-08'
df = pd.read_json('file.json', convert_dates=False)
print (df)
  2016-08-01  2016-09-01  2016-10-01  2016-11-01
0    2016-08        2799        2432           0
1       1475        1968        1375           0
2       3097        1244        2339           0
3       1305        1625        3038           0
4       1530        4385        2369           0
5       3515        4532        2497           0
6       1539        1276        4378           0
7       4989        3143        2075           0
8       3357        2745        1592           0
9       3224        2694        3958           0

如果同时使用两个参数:

df = pd.read_json('file.json', convert_dates=False, convert_axes=False)
print (df)
   2016-08  2016-09  2016-10  2016-11
0  2016-08     2799     2432        0
1     1475     1968     1375        0
2     3097     1244     2339        0
3     1305     1625     3038        0
4     1530     4385     2369        0
5     3515     4532     2497        0
6     1539     1276     4378        0
7     4989     3143     2075        0
8     3357     2745     1592        0
9     3224     2694     3958        0

【讨论】:

以上是关于Pandas `read_json` 函数将字符串转换为 DateTime 对象,即使指定了 `convert_dates=False` 属性的主要内容,如果未能解决你的问题,请参考以下文章

Pandas read_json() 使用简单的 JSON 字符串失败

在 pandas 中使用 read_json 导入单个记录

如何在 ```pandas.read_json(...)` 期间修复 ```ValueError: Trailing data```?

在 Pandas UnicodeDecodeError 中无法使用 pandas.read_json() 解码 JSON 文件中的 Unicode Ascii

如何让 pandas.read_json 将此 API 返回识别为有效的 .json?

Pandas_JSON和Pickle