Pandas Python-read_csv没有读取每一行的完整数据[重复]
Posted
技术标签:
【中文标题】Pandas Python-read_csv没有读取每一行的完整数据[重复]【英文标题】:Pandas Python- read_csv not reading complete data on each row [duplicate] 【发布时间】:2017-01-31 13:54:51 【问题描述】:我正在使用 read_csv 读取一个相当大的 csv 块(只读取第一行进行测试)。
data = read_csv('VOD_Properties.csv', nrows=1, low_memory=False)
print(data)
结果:
PROPERTIES
0 "video_id":241338,"play_uuid":"0d293b16-566a-...
excel中的原始数据:
"video_id":241338,"play_uuid":"0d293b16-566a-46e7-ac90-e3caa602a527","seconds":0.116,"current_state":"PLAY","total_seconds":100.032
为了测试数据是否只是没有显示,我将其转换为字符串:
string_data = data.to_string()
并打印字符串的最后几个字符,看看它们是否是'...':
6-566a-...
我尝试过调整参数,但没有任何改进。
提前致谢。
【问题讨论】:
我认为这不是读取所有数据的问题,而是不显示所有数据的问题。 Numpy、Pandas 等使用省略号表示未显示所有数据。 该行读得很好;就在打印 pandas 时会用省略号“...”截断宽列。您可以使用以下命令更改 pandas 的列宽显示阈值:How to remove ellipsis from a row in a Python Pandas series or data frame? 我们是否应该将其作为其副本关闭? 复制:***.com/questions/26277757/… 和 ***.com/questions/21028819/… T.Y.,我已经发布了您的解决方案:pandas.set_option('display.max_colwidth', 1000)
smci,是的,效果很好。谢谢!
【参考方案1】:
实际上,整行被正确读取,只是在打印 pandas 会用省略号“...”截断宽列时。
您可以按以下方式更改 pandas 的列宽显示阈值: How to remove ellipsis from a row in a Python Pandas series or data frame, shown when long lines/wide columns are truncated?
pandas.set_option('display.max_colwidth', 1000) # or whatever width
【讨论】:
以上是关于Pandas Python-read_csv没有读取每一行的完整数据[重复]的主要内容,如果未能解决你的问题,请参考以下文章
为啥用python的pandas读excel文件时会少掉一行数据
Pandas 基础 - 读/写 Excel 和 CSV 文件