正则表达式内容比较多,如果系统的学习会比较费时间,现在归纳一下scrapy需要用到的正则表达式
1.表示开头或者结尾:‘^‘+‘某个字符‘表示以这个字符开头,‘某个字符‘+‘$‘表示以这个字符结尾
2表示任意:‘.’表示任意字符,‘*‘前面的字符重复任意次,‘.*‘可以表示任意一堆字符,‘[]‘表示中括号里的字符只要任意出现一个就可以,另外中括号里的特殊字符不再有特殊意义其中的’^‘表示反,‘/w‘表示a-z,A-Z,0-9中任意字符‘/W‘表示其他任意字符
3.字符出现次数:‘.*‘出现任意次,‘.+‘至少出现一次,‘{n}‘出现n次,‘{n,}‘至少出现n次,‘{n,m}’至少出现n次至多出现m次
4.特殊字符反向匹配且贪婪匹配,‘?‘防止贪婪匹配,且不能反向匹配
5.其他:‘/s‘空白,‘/S‘除空白外的其他字符[\u4E00-\u9FAS]+表示中文,‘/d‘表示数字