如何在delphi中使用正则表达式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在delphi中使用正则表达式相关的知识,希望对你有一定的参考价值。

一、使用的单元:RegularExpressions(XE自带),PerlRegEx(第三方) 
推荐使用第一个
二、常见使用场景
1)、是否匹配成功
procedure TForm1.Button1Click(Sender: TObject); 
begin
if TRegEx.IsMatch(txt, pattern) then
begin
ShowMessage(’有匹配到’);
end; 
end;

2)、获取第一个匹配结果
procedure TForm1.Button2Click(Sender: TObject); 
var
match: TMatch; 
begin
match := TRegEx.Match(txt, pattern);
if match.Success then //或用一句话 if TRegEx.Match(txt, pattern).Success then
begin
ShowMessage(match.Value); //AAA1
end; 
end;

3)、获取所有匹配结果
procedure TForm1.Button3Click(Sender: TObject); 
var
matchs: TMatchCollection;
match: TMatch;
i: Integer; 
begin
matchs := TRegEx.Matches(txt, pattern);

Memo1.Clear;
for match in matchs do
begin
Memo1.Lines.Add(match.Value);
end;

Memo1.Lines.Add(’----------’);
for i := 0 to matchs.Count - 1 do
begin
Memo1.Lines.Add(matchs[i].Value);
end; 
end;
4)、使用 TMatch 对象的 NextMatch 遍历匹配结果时,需实例化对象 
procedure TForm1.Button4Click(Sender: TObject); 
var
reg: TRegEx;
match: TMatch; 
begin
reg := TRegEx.Create(pattern);
match := reg.Match(txt);

Memo1.Clear;
while match.Success do
begin
Memo1.Lines.Add(match.Value);
match := match.NextMatch;
end; 
end;

5)、替换
procedure TForm1.Button6Click(Sender: TObject); 
begin
Memo1.Text := TRegEx.Replace(txt, pattern, ’xxx’); //xxx xxx xxx xxx xxx xxx AAAA 
end;

6)、分割
procedure TForm1.Button7Click(Sender: TObject); 
var
rArr: TArray<string>;
s: string; 
begin
rArr := TRegEx.Split(’AAA,BBB;CCC,DDD EEE’, ’[,; ]’);

Memo1.Clear;
for s in rArr do
begin
Memo1.Lines.Add(s); //AAA/BBB/CCC/DDD/EEE
end; 
end;

TRegEx 还有一个 class 方法 Escape, 用于给特殊字符转义 
procedure TForm1.Button8Click(Sender: TObject); 
begin
Memo1.Text := TRegEx.Escape(’[]^$.|?*+()’); //: []^$.|?*+() 
end; 
三、常用正则表达式的书写
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配html标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]4,15$
评注:表单验证时很实用
匹配国内电话号码:\d3-\d8|\d4-\d7
评注:匹配形式如 0511-4405222 或 021-87888822
匹配腾讯QQ号:[1-9][0-9]4,
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]\d5(?!\d)
评注:中国邮政编码为6位数字
匹配身份证:\d15|\d18
评注:中国的身份证为15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用。
匹配特定数字:
^[1-9]\d*$ //匹配正整数
^-[1-9]\d*$ //匹配负整数
^-?[1-9]\d*$ //匹配整数
^[1-9]\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正。
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
参考技术A

根据所使用 delphi 版本的不同,正则表达式的使用也有所区别。

自 Delphi XE 后,delphi 内部集成了正则表达式的处理类 TRegEx,包含在单元 RegularExpressions 中。

TRegEx 被设计为一个 record ,使用时不用释放:

  TRegEx = record
  private
    FOptions: TRegExOptions;
    FMatchEvaluator: TMatchEvaluator;
    FNotifier: IInterface;
    FRegEx: TPerlRegEx;
    procedure InternalOnReplace(Sender: TObject; var ReplaceWith: string);
  public
    constructor Create(const Pattern: string; Options: TRegExOptions = [roNotEmpty]);

    function IsMatch(const Input: string): Boolean; overload;
    function IsMatch(const Input: string; StartPos: Integer): Boolean; overload;
    class function IsMatch(const Input, Pattern: string): Boolean;overload; static;
    class function IsMatch(const Input, Pattern: string; Options: TRegExOptions): Boolean; overload; static;

由于正则表达式相对比较复杂,进一步的详细资料,可以参阅网上的资料(如:“万一的 Delphi 博客”等)。

参考技术B XE之前的版本可以使用三方组件,XE之后的版本自带了正则表达式组件了 参考技术C delphi内部类提供了正则表达式,可以自行百度下 参考技术D http://mykb.amanzitel.com/archive/SuperKB/888/

如何在 Dart 中使用正则表达式?

【中文标题】如何在 Dart 中使用正则表达式?【英文标题】:How to use RegEx in Dart? 【发布时间】:2018-09-20 07:13:06 【问题描述】:

在 Flutter 应用程序中,我需要检查字符串是否与特定的 RegEx 匹配。但是,我从应用程序的 JavaScript 版本复制的 RegEx always 在 Flutter 应用程序中返回 false。我在regexr 上验证了 RegEx 是有效的,并且这个 RegEx 已经在 J​​avaScript 应用程序中使用,所以它应该是正确的。

感谢任何帮助!

正则表达式:/^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789/i

测试代码:

RegExp regExp = new RegExp(
  r"/^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789/i",
  caseSensitive: false,
  multiLine: false,
);
print("allMatches : "+regExp.allMatches("WS://127.0.0.1:56789").toString());
print("firstMatch : "+regExp.firstMatch("WS://127.0.0.1:56789").toString());
print("hasMatch : "+regExp.hasMatch("WS://127.0.0.1:56789").toString());
print("stringMatch : "+regExp.stringMatch("WS://127.0.0.1:56789").toString());

输出:

allMatches : ()
firstMatch : null
hasMatch : false
stringMatch : null

【问题讨论】:

【参考方案1】:

我认为您尝试在原始表达式字符串中包含选项,而您已经将其作为 RegEx 的参数( /i 不区分大小写被声明为 caseSensitive: false)。

// Removed /i at the end
// Removed / in front - Thanks to Günter for warning
RegExp regExp = new RegExp(
  r"^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789",
  caseSensitive: false,
  multiLine: false,
);
print("allMatches : "+regExp.allMatches("WS://127.0.0.1:56789").toString());
print("firstMatch : "+regExp.firstMatch("WS://127.0.0.1:56789").toString());
print("hasMatch : "+regExp.hasMatch("WS://127.0.0.1:56789").toString());
print("stringMatch : "+regExp.stringMatch("WS://127.0.0.1:56789").toString());

给予:

allMatches : (Instance of '_MatchImplementation')
firstMatch : Instance of '_MatchImplementation'
hasMatch : true
stringMatch : WS://127.0.0.1:56789

【讨论】:

开头的/ 在 Dart AFAIK 中也不起作用 谢谢! documentation 缺少这些基本但至关重要的信息,真是太可惜了。我只能希望 Dart 有一天会像 Go 一样有文档。 @NatoBoram,我对此表示赞同(我真的希望 Go 被选为 Flutter:) 我可以看到RegExp 构造函数没有给出代码示例,您必须查看类文档才能看到。我们可能希望两者兼有,以便轻松捕获习惯于 JavaScript 正则表达式语法的用户。 @lrn,我想我也查看了类文档,但它不存在。如果我记错了,你能给个链接吗? Dart 文档感觉就像是由班级成员创建的自动文档,没有额外的解释和\或示例(有示例但很少,更像是尝试自己看看)。【参考方案2】:

对于未来的观众来说,这是一个更普遍的答案。

Dart 中的正则表达式的工作方式与其他语言非常相似。您使用RegExp 类来定义匹配模式。然后使用hasMatch() 测试字符串上的模式。

示例

字母数字

final alphanumeric = RegExp(r'^[a-zA-Z0-9]+$');
alphanumeric.hasMatch('abc123');  // true
alphanumeric.hasMatch('abc123%'); // false

十六进制颜色

RegExp hexColor = RegExp(r'^#?([0-9a-fA-F]3|[0-9a-fA-F]6)$');
hexColor.hasMatch('#3b5');     // true
hexColor.hasMatch('#FF7723');  // true
hexColor.hasMatch('#000000z'); // false

提取文本

final myString = '25F8..25FF    ; Common # Sm   [8] UPPER LEFT TRIANGLE';

// find a variable length hex value at the beginning of the line
final regexp = RegExp(r'^[0-9a-fA-F]+'); 

// find the first match though you could also do `allMatches`
final match = regexp.firstMatch(myString);

// group(0) is the full matched text
// if your regex had groups (using parentheses) then you could get the 
// text from them by using group(1), group(2), etc.
final matchedText = match?.group(0);  // 25F8

还有一些例子here。

另见:

Extracting text from a string with regex groups in Dart

【讨论】:

@LeoK,它确实有效,但在这种情况下它不是很有用。你得到的是一个包含两个项目的列表:字符串开头25F8 之前的所有内容(这是一个空字符串)以及它之后的所有内容。【参考方案3】:

字符串模式 = r"[!-/:-@[-`-~]";

正则表达式 regExp = 正则表达式(模式);

使用它它正在工作

【讨论】:

以上是关于如何在delphi中使用正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

delphi中VBspcript_TRegExp类(正则表达式)怎么用

delphi正则表达式

正则表达式

如何使用正则表达式验证非空?

正则表达式2

常用的正则表达式集锦