[C/C++11]_[初级]_[使用正则表达式库regex]

Posted infoworld

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[C/C++11]_[初级]_[使用正则表达式库regex]相关的知识,希望对你有一定的参考价值。

场景

  1. 正则表达式在处理非常量字符串查找,替换时能很省事,如果稍微复杂点的字符串匹配, 没有正则表达式还真做不出来.
  2. C++11 为我们提供了正则表达式库. 使用起来比boost的正则库方便.
  3. 搞Java 的一定觉得很搞笑,这都是Java的标配功能, 怎么C++11才支持这个库,vs2010 以才支持.建议在处理字符串搜索替换时,直接用正则吧,代码量少,快速.

参考

std::regex_replace
std::regex_iterator
Regular Expressions (C++)

说明

  1. 正则表达式的语法我不多说了,vs2010 如果模式字符串写错,运行也会崩溃.一般调用正则方法时报错基本就是模式字符串写错了.
  2. 正则的语法真的很多,向前向后,分组…看参考吧,一般不需要全部学会就够用了.

例子


// test_reg.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include <regex>
#include <string>
#include <assert.h>
#include <iostream>

static std::string khtmlSnippet = "<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main.png\" width=\"30%\" height=\"30%\"></p>"
"<ol>"
"<li>ddd中文歌</li>"
"<li>xxx</li>"
"</ol>"
"<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main-about.png\" width=\"30%\" height=\"30%\"></p>"
"<ol>"
"<li>xxxxx</li>"
"</ol>"
"<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main-setting.png\" width=\"30%\" height=\"30%\"></p>";

void TestReplace()
{
    std::cout << "TestReplace ====" << std::endl;

    // 把所有 img src 的绝对路径替换为 images 开始的相对路径.
    // 使用分组即可.
    std::regex img_regex("(<img [^>]*src=[\"‘]{1})([^\"‘]*)\\\\(images\\\\[^\"‘]*[\"‘]{1}[^>]*>)");
    std::smatch color_match;

    std::string rep = "$1$3";
    std::string tmp = std::regex_replace(kHtmlSnippet,img_regex,rep);
    std::cout << tmp << std::endl;

}

void TestSearch()
{
    std::cout << "TestSearch ====" << std::endl;

    // 查找所有的img完整标签
    std::regex img_regex("<img [^>]+>");

    // 使用 std::regex_search 查询第一个匹配的字符串.
    std::smatch color_match;
    std::cout << "regex_search ====" << std::endl;
    if(std::regex_search(kHtmlSnippet, color_match, img_regex))
    {
        std::cout << color_match[0] << ‘\n‘;
    }

    // 使用类 std::regex_iterator 来进行多次搜索.
    std::cout << "sregex_iterator ====" << std::endl;
    auto words_begin =
        std::sregex_iterator(kHtmlSnippet.begin(), kHtmlSnippet.end(), img_regex);
    auto words_end = std::sregex_iterator();
    for (std::sregex_iterator i = words_begin; i != words_end; ++i)
    {
        std::smatch match = *i;                                                 
        std::string match_str = match.str();
        std::cout << match_str << ‘\n‘;
    }
}

int _tmain(int argc, _TCHAR* argv[])
{
    TestSearch();
    TestReplace();
    return 0;
}

输出:

TestSearch ====
regex_search ====
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main.png" width="30%" he
ight="30%">
sregex_iterator ====
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main.png" width="30%" he
ight="30%">
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main-about.png" width="3
0%" height="30%">
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main-setting.png" width=
"30%" height="30%">
TestReplace ====
<p><img src="images\main\main.png" width="30%" height="30%"></p><ol><li>ddd中文
歌</li><li>xxx</li></ol><p><img src="images\main\main-about.png" width="30%" hei
ght="30%"></p><ol><li>xxxxx</li></ol><p><img src="images\main\main-setting.png"
width="30%" height="30%"></p>

以上是关于[C/C++11]_[初级]_[使用正则表达式库regex]的主要内容,如果未能解决你的问题,请参考以下文章

r dplyr filter:正则表达式排除AND匹配

[C/C++11]_[初级]_[获取CPU支持的最合适的核心线程数]

[C/C++11]_[初级]_[获取CPU支持的最合适的核心线程数]

[C/C++11]_[初级]_[获取CPU支持的最合适的核心线程数]

[C/C++11]_[初级]_[获取CPU支持的最合适的核心线程数]

MYSQL初级学习笔记七:MySQL中使用正则表达式!(视频序号:初级_44)