np.genfromtxt 返回带有 'b' 的字符串 [重复]

Posted

技术标签:

【中文标题】np.genfromtxt 返回带有 \'b\' 的字符串 [重复]【英文标题】:np.genfromtxt returns string with 'b' [duplicate]np.genfromtxt 返回带有 'b' 的字符串 [重复] 【发布时间】:2020-11-13 05:34:43 【问题描述】:

我正在学习 NUMpy 的不同功能,并且我有一个名为 100-Sales-Records 的虚拟数据集 here。

现在我想使用np.genfromtxt 阅读它。我的阅读代码是

df3 = np.genfromtxt('100 Sales Records.csv', delimiter=',',names=True, dtype=None)

因为它是一个“csv”文件并且有字符串和浮点数。 现在的输出

pd.DataFramge(df3).head()

你可以看到所有字符串前面都有b。这是什么b 以及如何删除它?

【问题讨论】:

【参考方案1】:

答案是字符串前的b 表示它是一个通常以utf-8 编码返回的字节对象。它是一个字节对象。

要去掉,genfromtxt里面有个参数就是encoding,设置成utf-8

df3 = np.genfromtxt('100 Sales Records.csv', delimiter=',',names=True, dtype=None, encoding='utf-8')

这会给你想要的结果。

【讨论】:

以上是关于np.genfromtxt 返回带有 'b' 的字符串 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

numpy genfromtxt IndexError 使用评论时

numpy.genfromtxt:不明确的分隔符?

有没有办法使用给定目录中的 numpy.genfromtxt 从 csv 读取数据?

如何创建一个列表的列表

Numpy数组数据文件的读写

线性回归(非矩阵实现)