无法用熊猫读取 excel 文件

Posted

技术标签:

【中文标题】无法用熊猫读取 excel 文件【英文标题】:Trouble to read an excel file with pandas 【发布时间】:2019-01-26 21:52:03 【问题描述】:

我正在尝试使用 pandas 读取一个 excel 文件(+50000 行),它在所有情况下都会给我同样的错误。 代码:

strfile='C:\\Users\\...\\excel_files\\excelfile_01.xls'

尝试01:

import pandas as pd

data = pd.read_excel(strfile, low_memory=False)

尝试02:

import pandas as pd

data = pd.read_excel(strfile, encoding='utf-16-le',low_memory=False)

尝试03:

import pandas as pd

data = pd.read_excel(strfile, encoding='sys.getfilesystemencoding()',low_memory=False)

尝试04:

import pandas as pd

data = pd.read_excel(strfile, encoding='latin-1',low_memory=False)

所有情况下的错误:

UnicodeDecodeError: 'utf-16-le' codec can't decode bytes in position 146-147: unexpected end of data

任何帮助/提示将不胜感激。 提前致谢。

【问题讨论】:

encoding='latin-1'? @coldspeed,谢谢,已经测试过了,但与结果相同的错误 作为测试,您是否尝试过另存为 CSV 并使用pd.read_csv @jpp 我已经用 1 个文件进行了测试(我有 400 多个 excel 文件需要阅读)但给了我以下错误:'utf-8' codec can't decode byte 0xd0 in position 0:无效的继续字节 尝试以现代.xlsx 格式保存您的旧.xls 文件并将其发送至pd.read_excel() 【参考方案1】:

发布我之前的评论作为答案:

尝试以现代.xlsx 格式保存您的旧版.xls 文件并将其发送至pd.read_excel()

【讨论】:

以上是关于无法用熊猫读取 excel 文件的主要内容,如果未能解决你的问题,请参考以下文章

无法将熊猫数据框附加到现有的 Excel 工作表

熊猫读取 excel 导致“不是 zip 文件”

熊猫。如何从 ZIP 存档中读取 Excel 文件

多索引上的熊猫数据框 groupby

时间为 00:00 时,熊猫读取 excel 返回类型对象

无法在熊猫数据框中按时间戳索引