python的pandas读取excel时显示gbk怎么办
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python的pandas读取excel时显示gbk怎么办相关的知识,希望对你有一定的参考价值。
参考技术A 根据相关信息了解,可以在读取Excel文件时使用encoding参数来指定编码格式为‘gbk’,例如pd.read_excel(filename, encoding='gbk')即可解决此问题。 参考技术B 你可以使用python的pandas库中的read_excel函数来解决这个问题,并将参数encoding设置为utf-8,从而保证读取excel文件时不会出现乱码现象 参考技术C 解决方案\email\ham中的23.txt中第二段多了一个®(使用记事本打开显示的是“?”),导致解码失败,删除‘®’之后便可以继续执行。
使用windows-1252编码的方式读取txt,open txt文档时加一条encoding='windows-1252',
open('email/spam/%d.txt' % i, encoding="windows-1252").read()。 参考技术D 如果知道编码方式可以在open时指定
book = open_workbook('123.xls',encoding='cp1252')
在 Pandas 中使用 multiIndexing 时显示所有索引值
【中文标题】在 Pandas 中使用 multiIndexing 时显示所有索引值【英文标题】:Showing all index values when using multiIndexing in Pandas 【发布时间】:2016-11-07 18:11:33 【问题描述】:我希望在查看我的 DataFrame 时,我会看到 multiIndex 的所有值,包括后续行对于其中一个级别具有相同索引时。这是一个例子:
arrays = [['20', '50', '20', '20'],['N/A', 'N/A', '10', '30']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['Jim', 'Betty'])
pd.DataFrame([np.random.rand(1)]*4,index=index)
输出是:
0
Jim Betty
20 N/A 0.954973
50 N/A 0.954973
20 10 0.954973
30 0.954973
我想在西南角也有一个 20。也就是说,我希望我的 DataFrame 是:
0
Jim Betty
20 N/A 0.954973
50 N/A 0.954973
20 10 0.954973
20 30 0.954973
Pandas 有能力做到这一点吗?
【问题讨论】:
【参考方案1】:您需要将display.multi_sparse
设置为False
:
#if need temporary use option
with pd.option_context('display.multi_sparse', False):
print (df)
0
Jim Betty
20 N/A 0.201643
50 N/A 0.201643
20 10 0.201643
20 30 0.201643
如果整个笔记本都需要此显示选项,则可以按如下方式一劳永逸地设置该选项:
# if permanent use
import pandas as pd
pd.options.display.multi_sparse = False
Documentation:
display.multi_sparse真 “稀疏化” MultiIndex 显示(不在组内的外层显示重复元素)
【讨论】:
以上是关于python的pandas读取excel时显示gbk怎么办的主要内容,如果未能解决你的问题,请参考以下文章
如何从 Python Pandas 系列或数据框中的一行中删除省略号,当长行/宽列被截断时显示?