python爬虫学习记录
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫学习记录相关的知识,希望对你有一定的参考价值。
正则表达式中(.*?)是常用的匹配模式,匹配出了换行符以外的字符,是非贪婪模式,读取最少的匹配信息
在编译模式中是用re.S可以让(.*?)匹配任意字符,包括换行符。
try:
except Exception, e:
print e
捕获所有异常并打印异常信息
dir(),查看当前对象的所有可用方法,type()查看当前对象的类型
sys.exit(),os.exit()用来退出进程,第一个常用
以上是关于python爬虫学习记录的主要内容,如果未能解决你的问题,请参考以下文章
python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习