如何在delphi中使用正则表达式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在delphi中使用正则表达式相关的知识,希望对你有一定的参考价值。
一、使用的单元:RegularExpressions(XE自带),PerlRegEx(第三方)推荐使用第一个
二、常见使用场景
1)、是否匹配成功
procedure TForm1.Button1Click(Sender: TObject);
begin
if TRegEx.IsMatch(txt, pattern) then
begin
ShowMessage(’有匹配到’);
end;
end;
2)、获取第一个匹配结果
procedure TForm1.Button2Click(Sender: TObject);
var
match: TMatch;
begin
match := TRegEx.Match(txt, pattern);
if match.Success then //或用一句话 if TRegEx.Match(txt, pattern).Success then
begin
ShowMessage(match.Value); //AAA1
end;
end;
3)、获取所有匹配结果
procedure TForm1.Button3Click(Sender: TObject);
var
matchs: TMatchCollection;
match: TMatch;
i: Integer;
begin
matchs := TRegEx.Matches(txt, pattern);
Memo1.Clear;
for match in matchs do
begin
Memo1.Lines.Add(match.Value);
end;
Memo1.Lines.Add(’----------’);
for i := 0 to matchs.Count - 1 do
begin
Memo1.Lines.Add(matchs[i].Value);
end;
end;
4)、使用 TMatch 对象的 NextMatch 遍历匹配结果时,需实例化对象
procedure TForm1.Button4Click(Sender: TObject);
var
reg: TRegEx;
match: TMatch;
begin
reg := TRegEx.Create(pattern);
match := reg.Match(txt);
Memo1.Clear;
while match.Success do
begin
Memo1.Lines.Add(match.Value);
match := match.NextMatch;
end;
end;
5)、替换
procedure TForm1.Button6Click(Sender: TObject);
begin
Memo1.Text := TRegEx.Replace(txt, pattern, ’xxx’); //xxx xxx xxx xxx xxx xxx AAAA
end;
6)、分割
procedure TForm1.Button7Click(Sender: TObject);
var
rArr: TArray<string>;
s: string;
begin
rArr := TRegEx.Split(’AAA,BBB;CCC,DDD EEE’, ’[,; ]’);
Memo1.Clear;
for s in rArr do
begin
Memo1.Lines.Add(s); //AAA/BBB/CCC/DDD/EEE
end;
end;
TRegEx 还有一个 class 方法 Escape, 用于给特殊字符转义
procedure TForm1.Button8Click(Sender: TObject);
begin
Memo1.Text := TRegEx.Escape(’[]^$.|?*+()’); //: []^$.|?*+()
end;
三、常用正则表达式的书写
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
匹配html标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]4,15$
评注:表单验证时很实用
匹配国内电话号码:\d3-\d8|\d4-\d7
评注:匹配形式如 0511-4405222 或 021-87888822
匹配腾讯QQ号:[1-9][0-9]4,
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]\d5(?!\d)
评注:中国邮政编码为6位数字
匹配身份证:\d15|\d18
评注:中国的身份证为15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
评注:提取ip地址时有用。
匹配特定数字:
^[1-9]\d*$ //匹配正整数
^-[1-9]\d*$ //匹配负整数
^-?[1-9]\d*$ //匹配整数
^[1-9]\d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正。
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串 参考技术A
根据所使用 delphi 版本的不同,正则表达式的使用也有所区别。
自 Delphi XE 后,delphi 内部集成了正则表达式的处理类 TRegEx,包含在单元 RegularExpressions 中。
TRegEx 被设计为一个 record ,使用时不用释放:
TRegEx = recordprivate
FOptions: TRegExOptions;
FMatchEvaluator: TMatchEvaluator;
FNotifier: IInterface;
FRegEx: TPerlRegEx;
procedure InternalOnReplace(Sender: TObject; var ReplaceWith: string);
public
constructor Create(const Pattern: string; Options: TRegExOptions = [roNotEmpty]);
function IsMatch(const Input: string): Boolean; overload;
function IsMatch(const Input: string; StartPos: Integer): Boolean; overload;
class function IsMatch(const Input, Pattern: string): Boolean;overload; static;
class function IsMatch(const Input, Pattern: string; Options: TRegExOptions): Boolean; overload; static;
由于正则表达式相对比较复杂,进一步的详细资料,可以参阅网上的资料(如:“万一的 Delphi 博客”等)。
参考技术B XE之前的版本可以使用三方组件,XE之后的版本自带了正则表达式组件了 参考技术C delphi内部类提供了正则表达式,可以自行百度下 参考技术D http://mykb.amanzitel.com/archive/SuperKB/888/如何在 Dart 中使用正则表达式?
【中文标题】如何在 Dart 中使用正则表达式?【英文标题】:How to use RegEx in Dart? 【发布时间】:2018-09-20 07:13:06 【问题描述】:在 Flutter 应用程序中,我需要检查字符串是否与特定的 RegEx 匹配。但是,我从应用程序的 JavaScript 版本复制的 RegEx always 在 Flutter 应用程序中返回 false。我在regexr 上验证了 RegEx 是有效的,并且这个 RegEx 已经在 JavaScript 应用程序中使用,所以它应该是正确的。
感谢任何帮助!
正则表达式:/^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789/i
测试代码:
RegExp regExp = new RegExp(
r"/^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789/i",
caseSensitive: false,
multiLine: false,
);
print("allMatches : "+regExp.allMatches("WS://127.0.0.1:56789").toString());
print("firstMatch : "+regExp.firstMatch("WS://127.0.0.1:56789").toString());
print("hasMatch : "+regExp.hasMatch("WS://127.0.0.1:56789").toString());
print("stringMatch : "+regExp.stringMatch("WS://127.0.0.1:56789").toString());
输出:
allMatches : ()
firstMatch : null
hasMatch : false
stringMatch : null
【问题讨论】:
【参考方案1】:我认为您尝试在原始表达式字符串中包含选项,而您已经将其作为 RegEx 的参数( /i 不区分大小写被声明为 caseSensitive: false)。
// Removed /i at the end
// Removed / in front - Thanks to Günter for warning
RegExp regExp = new RegExp(
r"^WS1,2:\/\/\d1,3\.\d1,3\.\d1,3\.\d1,3:56789",
caseSensitive: false,
multiLine: false,
);
print("allMatches : "+regExp.allMatches("WS://127.0.0.1:56789").toString());
print("firstMatch : "+regExp.firstMatch("WS://127.0.0.1:56789").toString());
print("hasMatch : "+regExp.hasMatch("WS://127.0.0.1:56789").toString());
print("stringMatch : "+regExp.stringMatch("WS://127.0.0.1:56789").toString());
给予:
allMatches : (Instance of '_MatchImplementation')
firstMatch : Instance of '_MatchImplementation'
hasMatch : true
stringMatch : WS://127.0.0.1:56789
【讨论】:
开头的/
在 Dart AFAIK 中也不起作用
谢谢! documentation 缺少这些基本但至关重要的信息,真是太可惜了。我只能希望 Dart 有一天会像 Go 一样有文档。
@NatoBoram,我对此表示赞同(我真的希望 Go 被选为 Flutter:)
我可以看到RegExp
构造函数没有给出代码示例,您必须查看类文档才能看到。我们可能希望两者兼有,以便轻松捕获习惯于 JavaScript 正则表达式语法的用户。
@lrn,我想我也查看了类文档,但它不存在。如果我记错了,你能给个链接吗? Dart 文档感觉就像是由班级成员创建的自动文档,没有额外的解释和\或示例(有示例但很少,更像是尝试自己看看)。【参考方案2】:
对于未来的观众来说,这是一个更普遍的答案。
Dart 中的正则表达式的工作方式与其他语言非常相似。您使用RegExp
类来定义匹配模式。然后使用hasMatch()
测试字符串上的模式。
示例
字母数字
final alphanumeric = RegExp(r'^[a-zA-Z0-9]+$');
alphanumeric.hasMatch('abc123'); // true
alphanumeric.hasMatch('abc123%'); // false
十六进制颜色
RegExp hexColor = RegExp(r'^#?([0-9a-fA-F]3|[0-9a-fA-F]6)$');
hexColor.hasMatch('#3b5'); // true
hexColor.hasMatch('#FF7723'); // true
hexColor.hasMatch('#000000z'); // false
提取文本
final myString = '25F8..25FF ; Common # Sm [8] UPPER LEFT TRIANGLE';
// find a variable length hex value at the beginning of the line
final regexp = RegExp(r'^[0-9a-fA-F]+');
// find the first match though you could also do `allMatches`
final match = regexp.firstMatch(myString);
// group(0) is the full matched text
// if your regex had groups (using parentheses) then you could get the
// text from them by using group(1), group(2), etc.
final matchedText = match?.group(0); // 25F8
还有一些例子here。
另见:
Extracting text from a string with regex groups in Dart【讨论】:
@LeoK,它确实有效,但在这种情况下它不是很有用。你得到的是一个包含两个项目的列表:字符串开头25F8
之前的所有内容(这是一个空字符串)以及它之后的所有内容。【参考方案3】:
字符串模式 = r"[!-/:-@[-`-~]";
正则表达式 regExp = 正则表达式(模式);
使用它它正在工作
【讨论】:
以上是关于如何在delphi中使用正则表达式的主要内容,如果未能解决你的问题,请参考以下文章