pandas.DataFrame.loc好慢,怎么遍历访问DataFrame比较快

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas.DataFrame.loc好慢,怎么遍历访问DataFrame比较快相关的知识,希望对你有一定的参考价值。

如果用for来遍历,pandas比普通的python程序还要慢.

试试Series.apply函数来调用do_some_things_with_time,自然就得到了一个新的处理过的time列.
df.time2=df.time.apply(do_some_things_with_time)
或者直接赋值给df.time也行
参考技术A 通过dataframe.values把dataframe里的值取出来,取出来的值是个numpy可以识别的二维数组,通过np[x,y]的形式对该二维数组遍历和赋值,速度会提高非常多。
numpy内置函数处理数据的速度是C语言级别的,写程序时,尽量使用np的内置函数,尤其是涉及循环的问题时。

以上是关于pandas.DataFrame.loc好慢,怎么遍历访问DataFrame比较快的主要内容,如果未能解决你的问题,请参考以下文章

pandas.DataFrame.loc好慢,怎么遍历访问DataFrame比较快

Python pandas.DataFrame.loc函数方法的使用

Pandas Dataframe .loc + 更新非唯一日期时间索引?

pandas数据框loc属性语法及示例

004.pandas.DataFrame

004.pandas.DataFrame