Pandas.read_csv:需要反斜杠分隔符?

Posted

技术标签:

【中文标题】Pandas.read_csv:需要反斜杠分隔符?【英文标题】:Pandas.read_csv: backslash delimiter required? 【发布时间】:2018-08-07 00:55:00 【问题描述】:

出于某种奇怪的原因,我正在将一个文件直接读入 pandas,并将反斜杠作为分隔符。这是代码:试图用 escapechar 作为参数来转义反斜杠,因为我在某处找到了但这不起作用。如何将其直接读入 pandas?

raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\\', delimiter = "\\") 

【问题讨论】:

可以添加数据样本吗?也许只需要删除escapechar='\\' 不,我在分隔符不起作用后添加了 escapechar。这是第一行:abk\taze\t1。需要将其分成三列。 【参考方案1】:

我不认为escapechar 是您的问题/修复。我用以下代码阅读了文件,没有任何问题。解决方案是使用可变空格作为分隔符。

import pandas as pd

raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
                  delim_whitespace=True)

raw.head(10)

#   original_language target_language  num_translations
# 0               abk             aze                 1
# 1               abk             bul                 1
# 2               abk             deu                 1
# 3               abk             eng                 2
# 4               abk             est                 2
# 5               abk             fin                 1
# 6               abk             hin                 1
# 7               abk             kat                38
# 8               abk             kaz                 1
# 9               abk             kbd                 2

【讨论】:

太棒了。谢谢。 但是为什么呢?谢谢

以上是关于Pandas.read_csv:需要反斜杠分隔符?的主要内容,如果未能解决你的问题,请参考以下文章

python中的正斜杠反斜杠

对于不规则的分隔符,如何使 pandas read_csv 中的分隔符更灵活 wrt 空格?

Python 正斜杠/与反斜杠

路径中 斜杠/和反斜杠 的区别

斜杠/和反斜杠 的区别

斜杠/和反斜杠的区别