在 Google colab 中解码 .xlsx 时遇到问题

Posted

技术标签:

【中文标题】在 Google colab 中解码 .xlsx 时遇到问题【英文标题】:Trouble decoding .xlsx in Google colab 【发布时间】:2019-10-03 10:42:36 【问题描述】:

我不知道如何在 Google colab 中查看 xlsx 数据。这种完全相同的格式适用于 CSV 文件,但它表示编解码器无法解码某些内容。请帮忙!

from google.colab import files

files.download('example_02.xlsx')


from google.colab import files

uploaded = files.upload()

Data_03.xlsx(application/vnd.openxmlformats-officedocument.spreadsheetml.sheet) - 10513 bytes, last modified: 10/3/2019 - 100% done
Saving Data_03.xlsx to Data_03.xlsx

import pandas as pd
import io
mydata_03 = pd.read_csv(io.StringIO(uploaded['Data_03.xlsx'].decode('utf-8')))

---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-56-cb1bbea653c8> in <module>()
      1 import pandas as pd
      2 import io
----> 3 mydata_03 = pd.read_csv(io.StringIO(uploaded['Data_03.xlsx'].decode('utf-8')))

UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte

【问题讨论】:

【参考方案1】:

xlsx 文件不是 CSV。您需要将电子表格导出为 CSV。

看这里:

https://support.office.com/en-us/article/import-or-export-text-txt-or-csv-files-5250ac4c-663c-47ce-937b-339e391393ba

【讨论】:

以上是关于在 Google colab 中解码 .xlsx 时遇到问题的主要内容,如果未能解决你的问题,请参考以下文章

如何在 google colab 中启用拼写检查器(colab 在 linux OS 上运行)?

google.colab 模块中是不是有关闭运行时的功能

我们如何在 colab.research.google.com 中使用 Selenium Webdriver?

如何在google colab中有效地使用内存?

colab中的Python Pandas:UnicodeDecodeError:'utf-8'编解码器无法解码位置0的字节0xd3:无效的延续byteUnicodeDecodeError:

如何在 Google 的 Colab 中安装 Python 包?