使用正则表达式的逗号分隔字符串到数组
Posted
技术标签:
【中文标题】使用正则表达式的逗号分隔字符串到数组【英文标题】:Comma delimited string to array using regular expressions 【发布时间】:2016-06-22 22:14:43 【问题描述】:我有一个字符串:strString = first,last,,4443334444
我想用正则表达式把这个字符串拆分成一个数组。
我正在使用这个正则表达式[\""].+?[\""]|[^,]+
,但它忽略了最后一个单词后面的空格。
所以,我的数组看起来像这样:
[0] => first
[1] => last
[2] => 4443334444
代替:
[0] => first
[1] => last
[2] =>
[3] => 4443334444
我想保留这个空间。
任何帮助将不胜感激。
【问题讨论】:
你使用什么语言? 为什么不直接使用string.split(',')
?
@evolutionxbox:因为它会错误地拆分"Text, text"
。 @TheGooose,试试"[^"\\]*(?:\\.[^"\\]*)*"|[^,]+|(?<=^|,)(?=$|,)
。
Regex to split a CSV的可能重复
@Wiktor 感谢您的回复,它具有所需的输出,并考虑了带引号的合格文本,这对我的用例很有用。我非常感谢所有的回复和这个很棒的社区。span>
【参考方案1】:
你可以使用
"[^"\\]*(?:\\.[^"\\]*)*"|[^,]+|(?<=^|,)(?=$|,)
见regex demo
表达式由
组成"[^"\\]*(?:\\.[^"\\]*)*"
- 支持转义序列的双引号字符串文字
|
- 或
[^,]+
- 除,
之外的 1 个或多个字符
|
- 或
(?<=^|,)(?=$|,)
- 逗号之间或字符串开头/结尾和逗号之间的任何空字符串。
【讨论】:
【参考方案2】:你的表达有几个问题。
-
第一个
[\""]
是多余的,使用["]
或更好的"
(没有
字符类)代替。
其次,您的实际问题是由于
+
运算符至少需要 一个 字符(但
逗号之间没有,因此不允许空字段)。
第三,这可能是一些CSV
的输出,所以为什么不使用
explode()
或类似功能?
如果您坚持使用正则表达式,您可能会遇到:
".*?"|[^,]*
见a demo on regex101.com。
【讨论】:
【参考方案3】:不确定是否有办法获取两个逗号之间的元素,因为它没有正则表达式。我能想到的最好的方法是:
str.match(/(?:[^,]+)|,,/g)
=> ["first", "last", ",,", "4443334444"]
但是您需要将“,,”翻译成一个空字符串。
您使用正则表达式是否有原因?你的语言有 .split() 函数吗? https://developer.mozilla.org/en-US/docs/Web/javascript/Reference/Global_Objects/String/split
【讨论】:
以上是关于使用正则表达式的逗号分隔字符串到数组的主要内容,如果未能解决你的问题,请参考以下文章