python+pandas+openpyxl下载xls illegalCharacterError

Posted bierxiaobia

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python+pandas+openpyxl下载xls illegalCharacterError相关的知识,希望对你有一定的参考价值。

 

 

仅仅是urllib2.unquote_plus解码是不够的,需要将特殊字符去掉

ILLEGAL_CHARACTERS_RE = re.compile(r‘[00-10]|[13-14]|[16-37]|xef|xbf‘)
value = ILLEGAL_CHARACTERS_RE.sub(‘‘, origin_value)
由于xef|xbf的存在,导致字符串乱码,查了一下这是作为utf-8 BOM的存在,需要过滤掉。

BOM: https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8

ASCII Characters: http://donsnotes.com/tech/charsets/ascii.html

 

Then, it worked for me.

以上是关于python+pandas+openpyxl下载xls illegalCharacterError的主要内容,如果未能解决你的问题,请参考以下文章

openoffice calc - 换行导致单元格中的重复值(pandas/openpyxl)

Pandas与openpyxl库的超强结合,再见,Excel!

Pandas与openpyxl库的超强结合,再见,Excel!

Pandas与openpyxl库的超强结合,再见,Excel!

如何使用 openpyxl / pandas 或任何 python 将我从几个 excel 表中提取的字符串数据保存到新工作簿中?

Python3 读取和写入excel xlsx文件 使用openpyxl