Python_爬虫_数据解析回顾

Posted helloboke

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python_爬虫_数据解析回顾相关的知识,希望对你有一定的参考价值。

--数据解析原理

  --定位标签

  --提取标签中存储的数据

--xpath解析原理

  --实例化一个etree的对象且将解析的页面源码数据加载到该对象中

  --通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析

      -- //tagName

      -- //tagName[@attr = ‘value‘]

      -- //tagName[index]

      -- /text() //text()

      -- /@attrName

--bs4解析原理

  --实例化一个bs4的对象且将解析的页面源码数据加载到该对象中

  --通过相关的方法和属性进行数据解析

      -- soup.tagName

      -- soup.find(‘tagName‘, attrName = ‘value‘)  <==> find_all()

      -- select(‘css选择器‘) //标签, 类, id, 层级

      -- string,text,get_text()

      -- tag[‘attrName‘]

 

 

  

以上是关于Python_爬虫_数据解析回顾的主要内容,如果未能解决你的问题,请参考以下文章

Python_爬虫_BeautifulSoup网页解析库

Python爬虫(十四)_BeautifulSoup4 解析器

Python爬虫如何获取网页Network中某个文件的response?

如何入门 Python 爬虫

Python爬虫连载2-reponseparse简介

python爬虫模块之HTML解析模块