python爬虫学习记录

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫学习记录相关的知识,希望对你有一定的参考价值。

正则表达式中(.*?)是常用的匹配模式,匹配出了换行符以外的字符,是非贪婪模式,读取最少的匹配信息

在编译模式中是用re.S可以让(.*?)匹配任意字符,包括换行符。

try:

except Exception, e:

  print e

捕获所有异常并打印异常信息

dir(),查看当前对象的所有可用方法,type()查看当前对象的类型

sys.exit(),os.exit()用来退出进程,第一个常用

 

以上是关于python爬虫学习记录的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫学习记录

关于在学习python爬虫时的学习记录

python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习

python爬虫学习记录解析库的使用——pyquery

python爬虫学习记录解析库的使用——BeautifulSoup

python爬虫学习记录基本库的使用——requests