Pandas.read_csv:需要反斜杠分隔符?
Posted
技术标签:
【中文标题】Pandas.read_csv:需要反斜杠分隔符?【英文标题】:Pandas.read_csv: backslash delimiter required? 【发布时间】:2018-08-07 00:55:00 【问题描述】:出于某种奇怪的原因,我正在将一个文件直接读入 pandas,并将反斜杠作为分隔符。这是代码:试图用 escapechar 作为参数来转义反斜杠,因为我在某处找到了但这不起作用。如何将其直接读入 pandas?
raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\\', delimiter = "\\")
【问题讨论】:
可以添加数据样本吗?也许只需要删除escapechar='\\'
。
不,我在分隔符不起作用后添加了 escapechar。这是第一行:abk\taze\t1。需要将其分成三列。
【参考方案1】:
我不认为escapechar
是您的问题/修复。我用以下代码阅读了文件,没有任何问题。解决方案是使用可变空格作为分隔符。
import pandas as pd
raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
delim_whitespace=True)
raw.head(10)
# original_language target_language num_translations
# 0 abk aze 1
# 1 abk bul 1
# 2 abk deu 1
# 3 abk eng 2
# 4 abk est 2
# 5 abk fin 1
# 6 abk hin 1
# 7 abk kat 38
# 8 abk kaz 1
# 9 abk kbd 2
【讨论】:
太棒了。谢谢。 但是为什么呢?谢谢以上是关于Pandas.read_csv:需要反斜杠分隔符?的主要内容,如果未能解决你的问题,请参考以下文章