正则表达式

Posted sitr

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。

正则表达式

正则表达式的基础知识

  • 原子
    • 普通字符 “yue”即为三个原子y u e
    • 非打印字符
    • 原子表
      • [xyz]中xyz可以匹配
      • [^xyz]除了xzy都可以匹配
    • 通用字符
      • w W d D s S
      • 技术图片
  • 元字符
    • 常见的元字符技术图片
    • 任意匹配元字符
    • 边界限制元字符
    • 限定符
    • 模式选择符
    • 模式单元
  • 模式修正
    • 技术图片
  • 贪婪模式与懒惰模式

正则表达式常见函数

  • re.match()函数
    • 从源字符开头开始检索
  • re.search()
    • 从全文检索
  • 全局匹配函数
    • re.compile()对正则表达式预编译
    • 编译后,使用findall()全部找出
  • re.sub()函数
    • re.sub(pattern,rep,string,max)
    • pattern 正则表达式
    • rep要替换成的字符
    • string 源字符
    • max 代表最多可替换的次数

Cookie

  • Cookie常用于保存会话信息

Cookiejar

Cookiejar是Python3中用于处理Cookie的库。

进行Cookie处理的常用思路:

  1. 导入Cookie处理模块http.cookiejar
  2. 使用http.cookiejar.CookieJar()创建CookieJar对象
  3. 使用HTTPCookieProcessor创建cookie处理器,并以其为参数构建opener对象
  4. 创建全局默认的opener对象

多线程爬虫

?

Trackback解读

? Trackback

以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

PHP 正则表达式总结

正则表达式

正则表达式

正则表达式“或“的使用

正则表达式 验证数字格式 非负数 小数点后保留两位 数字正则 double正则

JS正则表达式详解