Excel-VBA正则表达式提取文本案例

Posted yimengtianya1

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Excel-VBA正则表达式提取文本案例相关的知识,希望对你有一定的参考价值。

  背景是这样的,我手上有一份统计表,需要将IP地址里的省市提取出来,以便于处理。因此我首先想到了Python里的正则表达式,打算写一个自定义函数去批量提取。然而之前没学VBA里的正则表达式语法,因此就去网上搜了一下,结果发现根本不能运行。几经辗转,总算搞定,因此总结一下,供后来者参考。

  编程目的:实现IP地址中省市信息的提取。    技术分享图片

    主要涉及的知识点:VBA函数、正则表达式

    代码如下:

Function 提取省市(rng As Range, name)
    
    Application.Volatile
    Set regx = CreateObject("vbscript.regexp")
    
    With regx
        .Global = True
        .Pattern = "[u4e00-u9fa5]+"
        Set mat = .Execute(rng)
    End With
    
    Select Case name
    
        Case "省"
            提取省市 = mat.Item(0).Value
            
        Case "市"
            提取省市 = mat.Item(1).Value
        
        Case Else
            MsgBox ("输入有误")
            
    End Select
    
End Function

     代码解释:

  1、rng As Range, name:传递两个参数,第一个参数为单元格参数。

  2、Application.Volatile  Set regx = CreateObject("vbscript.regexp"):创建正则表达式对象,固定语法。

  3、With regx

     .Global = True

     .Pattern = "[u4e00-u9fa5]+"

    Set mat = .Execute(rng)

    End With

  Global:表示是否进行全局检索,True表示将所有匹配的结果返回。False则是只返回第一个匹配结果。

  Pattern = "[u4e00-u9fa5]+"就是正则表达式了,其中[u4e00-u9fa5]+表示匹配中文字符串。

  4、Set mat = .Execute(rng):即执行正则表达式。返回一个matchcollection类型的集合,即匹配到的所有结果。

  5、接下来是一个多条件判断语句,相当于If ...Elif... Else...End If 。

  6、提取省市 = mat.Item(0).Value:前面我们提到mat是一个matchcollection类型的集合,mat.Item(0)表示读取第一个匹配结果,Value表示读取它的值。最后将这个值赋给函数。也可以不用后面的value。

以上是关于Excel-VBA正则表达式提取文本案例的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式多用法

使用 Java + 正则表达式从文本文档中提取 URL

awk扩展应用

字符串应用,expect预期交互,数组,正则表达式

Java提取文本文档中的所有网址(小案例介绍正则基础知识)

文本区域输入上的 JavaScript 正则表达式