python 从维基百科页面中截取所有表格标题
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 从维基百科页面中截取所有表格标题相关的知识,希望对你有一定的参考价值。
import urllib.request
from bs4 import BeautifulSoup
WIKIPEDIA_URL = 'http://en.wikipedia.org/wiki/'
TARGET_URL = WIKIPEDIA_URL + 'list_of_highest_mountains'
INDENT = ' ' * 2
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
page = opener.open(TARGET_URL)
soup = BeautifulSoup(page)
print("PAGE:", TARGET_URL)
for table_num, table in enumerate(soup('table')):
print()
print("{}Table.{}:".format(INDENT, table_num + 1))
for header_num, table_header in enumerate(table('th')):
header = table_header.get_text()
print("{}{}. {}".format(INDENT * 2, header_num, header))
以上是关于python 从维基百科页面中截取所有表格标题的主要内容,如果未能解决你的问题,请参考以下文章
python 脚本我曾经重命名所有F.R.I.E.N.D.S.通过从维基百科中获取名称来获取epsiodes
如何从维基百科页面中提取数据
Python - BS4 - 仅使用表头+保存为字典从维基百科表中提取子表
在Scrapy中递归折叠二级链接
如何获得Python中的维基百科讨论页内容
python 抓取维基百科,从随机文章开始。点击每篇文章中的第一个链接,看看我们结束的地方!扰流警报:可能在t