MIMIC-III 数据集处理 | OverflowError: Overflow in int64 addition 解决方法

Posted 叶庭云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MIMIC-III 数据集处理 | OverflowError: Overflow in int64 addition 解决方法相关的知识,希望对你有一定的参考价值。

MIMIC-III 数据集处理,遇到问题如下:

由入院时间减去出生时间计算入院时年龄,遇到报错:OverflowError: Overflow in int64 addition。查看了一下本地的 pandas 版本为 1.3.5 ,如下所示:

Github Issues 有好心人回答了一些解决方法,主要包括降低 pandas 版本为 0.23.4 或 0.20.3(但 pandas 是很多库的依赖,这可能导致与其他依赖库发生冲突,一般不要轻易改变它的版本)。所以最好是改写一下代码:

df1_2['ADMITTIME'] = pd.to_datetime(df1_2['ADMITTIME']).dt.date
df1_2['DOB'] = pd.to_datetime(df1_2['DOB']).dt.date
df1_2["AGE"] = df1_2.apply(lambda e: (e['ADMITTIME'] - e['DOB']).days / 365, axis=1)

结果如下:


Reference:

  • Github Issues:https://github.com/YerevaNN/mimic3-benchmarks/issues/84

以上是关于MIMIC-III 数据集处理 | OverflowError: Overflow in int64 addition 解决方法的主要内容,如果未能解决你的问题,请参考以下文章

数据挖掘任务2:医学数据库MIMIC-III数据处理

KDD MIMIC-IV与MIMIC-III的区别

如何为临床数据集确定数据仓库模式?

css 具有纯CSS的等大小列。使用底部填充边距技巧,通过overflo将过度折叠元素切割成适当的大小

文本溢出处理

仅部署多维数据集架构,不进行处理