Pandas Python-read_csv没有读取每一行的完整数据[重复]

Posted

技术标签:

【中文标题】Pandas Python-read_csv没有读取每一行的完整数据[重复]【英文标题】:Pandas Python- read_csv not reading complete data on each row [duplicate] 【发布时间】:2017-01-31 13:54:51 【问题描述】:

我正在使用 read_csv 读取一个相当大的 csv 块(只读取第一行进行测试)。

data = read_csv('VOD_Properties.csv', nrows=1, low_memory=False)
print(data)

结果:

                                      PROPERTIES
0  "video_id":241338,"play_uuid":"0d293b16-566a-...

excel中的原始数据:

"video_id":241338,"play_uuid":"0d293b16-566a-46e7-ac90-e3caa602a527","seconds":0.116,"current_state":"PLAY","total_seconds":100.032

为了测试数据是否只是没有显示,我将其转换为字符串:

string_data = data.to_string()

并打印字符串的最后几个字符,看看它们是否是'...':

6-566a-...

我尝试过调整参数,但没有任何改进。

提前致谢。

【问题讨论】:

我认为这不是读取所有数据的问题,而是不显示所有数据的问题。 Numpy、Pandas 等使用省略号表示未显示所有数据。 该行读得很好;就在打印 pandas 时会用省略号“...”截断宽列。您可以使用以下命令更改 pandas 的列宽显示阈值:How to remove ellipsis from a row in a Python Pandas series or data frame? 我们是否应该将其作为其副本关闭? 复制:***.com/questions/26277757/… 和 ***.com/questions/21028819/… T.Y.,我已经发布了您的解决方案:pandas.set_option('display.max_colwidth', 1000) smci,是的,效果很好。谢谢! 【参考方案1】:

实际上,整行被正确读取,只是在打印 pandas 会用省略号“...”截断宽列时。

您可以按以下方式更改 pandas 的列宽显示阈值: How to remove ellipsis from a row in a Python Pandas series or data frame, shown when long lines/wide columns are truncated?

pandas.set_option('display.max_colwidth', 1000) # or whatever width

【讨论】:

以上是关于Pandas Python-read_csv没有读取每一行的完整数据[重复]的主要内容,如果未能解决你的问题,请参考以下文章

为啥用python的pandas读excel文件时会少掉一行数据

Pandas 基础 - 读/写 Excel 和 CSV 文件

python [用pandas读csv] #py

对于 HDF5 的快速读/写性能推荐的压缩是啥(在 Python/pandas 中)?

numpy pandas读文件 numpy数值计算模块

使用 Pandas 和/或 Numpy 进行读/写操作的最快文件格式 [关闭]