pd.read_html-ValueError:未找到表

Posted

技术标签:

【中文标题】pd.read_html-ValueError:未找到表【英文标题】:pd.read_html-ValueError: No tables found 【发布时间】:2020-07-18 08:52:09 【问题描述】:

我只是想通过 html 加载 csv 文件,但我遇到了错误

我的代码:

将熊猫导入为 pd

df = pd.read_html("https://raw.githubusercontent.com/hadley/data-baby-names/master/baby-names.csv")

df.head()

显示错误:

ValueError Traceback(最近一次调用最后一次) 在 2 将熊猫导入为 pd 3 网址 = "http://raw.githubusercontent.com/hadley/data-baby-names/master/baby-names.csv"

4 df = pd.read_html("https://raw.githubusercontent.com/hadley/data-baby-names/master/baby-names.csv")

5 df.head() …… …… ValueError: 未找到表

ValueError: 未找到表 这是我的第一个 *** 问题,所以如果我无法传达信息,请告诉我,任何帮助将不胜感激,谢谢

【问题讨论】:

使用pd.read_csv()pd.read_table() 用于处理 HTML 文档中来自 <table> 标记的数据 【参考方案1】:

pd.read_html()用于处理HTML文档,读取待处理HTML文档内<table>标签内的数据。

要处理 CSV 文件,您需要 pd.read_csv()

这将接受一个 URL 作为参数,因此以下内容应该适合您:

import pandas as pd
url = "https://raw.githubusercontent.com/hadley/data-baby-names/master/baby-names.csv"
df = pd.read_csv(url)
df.head()

【讨论】:

Yaa Mark 昨天我也做了同样的事情,但是我再次应用了类似的方法来处理 .xls 格式的 excel 文件。但我得到了字节错误。下面我已经粘贴了代码。 import pandas as pd df = pd.read_excel("github.com/jbwhit/coal-exploration/blob/master/data/…) df.head() 错误:XLRDError:不支持的格式,或损坏的文件:预期的 BOF 记录;找到 b'\n\n\n\n\n\n pd.read_excel() 您需要确保已安装相关的 Excel 模块:pip3 install openpyxl xlrd 我向您推荐 Wes McKinney 的 Python for Data Analysis

以上是关于pd.read_html-ValueError:未找到表的主要内容,如果未能解决你的问题,请参考以下文章

未找到配置文件:未找到未过期的配置文件

“注意:未定义的变量”、“注意:未定义的索引”、“警告:未定义的数组键”和“注意:未定义的偏移量”使用 PHP

“注意:未定义的变量”、“注意:未定义的索引”、“警告:未定义的数组键”和“注意:未定义的偏移量”使用 PHP

“注意:未定义的变量”、“注意:未定义的索引”、“警告:未定义的数组键”和“注意:未定义的偏移量”使用 PHP

未处理的拒绝 SequelizeEagerLoadingError:未关联,并且无法读取未定义的属性“getTableName”

未捕获的 ReferenceError:未定义 ytcfg(也未定义 __ytRIL)