pands模块的妙用爬取网页中的表格

Posted pythonywy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pands模块的妙用爬取网页中的表格相关的知识,希望对你有一定的参考价值。

拿我这篇为例https://www.cnblogs.com/pythonywy/p/11574340.html

import pandas as  pd

df = pd.read_html('https://www.cnblogs.com/pythonywy/p/11574340.html')
print(df)
'''[             设备 rpx换算px (屏幕宽度/750) px换算rpx (750/屏幕宽度)
0       iPhone5      1rpx = 0.42px      1px = 2.34rpx
1       iPhone6       1rpx = 0.5px         1px = 2rpx
2  iPhone6 Plus     1rpx = 0.552px      1px = 1.81rpx,                 选择器              样例                             样例描述
0            .class          .intro         选择所有拥有 class="intro" 的组件
1               #id      #firstname          选择拥有 id="firstname" 的组件
2           element            view                     选择所有 view 组件
3  element, element  view, checkbox  选择所有文档的 view 组件和所有的 checkbox 组件
4           ::after     view::after                  在 view 组件后边插入内容
5          ::before    view::before                  在 view 组件前边插入内容]
'''

主要就是处理一些特别的网站,

pands用法点我

以上是关于pands模块的妙用爬取网页中的表格的主要内容,如果未能解决你的问题,请参考以下文章

Python爬取当当网书籍数据,并数据可视化展示

Python招聘岗位信息聚合系统源码(爬虫爬取数据分析可视化互动等功能)...

Python招聘岗位信息聚合系统源码(爬虫爬取数据分析可视化互动等功能)...

PHP 爬取网页中表格数据

定向爬取网页内容

爬虫怎么用css对表格进行定位