使用正则表达式的逗号分隔字符串到数组

Posted

技术标签:

【中文标题】使用正则表达式的逗号分隔字符串到数组【英文标题】:Comma delimited string to array using regular expressions 【发布时间】:2016-06-22 22:14:43 【问题描述】:

我有一个字符串:strString = first,last,,4443334444

我想用正则表达式把这个字符串拆分成一个数组。

我正在使用这个正则表达式[\""].+?[\""]|[^,]+,但它忽略了最后一个单词后面的空格。

所以,我的数组看起来像这样:

        [0] => first
        [1] => last
        [2] => 4443334444 

代替:

        [0] => first
        [1] => last
        [2] => 
        [3] => 4443334444

我想保留这个空间。

任何帮助将不胜感激。

【问题讨论】:

你使用什么语言? 为什么不直接使用string.split(',') @evolutionxbox:因为它会错误地拆分"Text, text"。 @TheGooose,试试"[^"\\]*(?:\\.[^"\\]*)*"|[^,]+|(?<=^|,)(?=$|,) Regex to split a CSV的可能重复 @Wiktor 感谢您的回复,它具有所需的输出,并考虑了带引号的合格文本,这对我的用例很有用。我非常感谢所有的回复和这个很棒的社区。​​span> 【参考方案1】:

你可以使用

"[^"\\]*(?:\\.[^"\\]*)*"|[^,]+|(?<=^|,)(?=$|,)‌​

见regex demo

表达式由

组成 "[^"\\]*(?:\\.[^"\\]*)*" - 支持转义序列的双引号字符串文字 | - 或 [^,]+ - 除, 之外的 1 个或多个字符 | - 或 (?&lt;=^|,)(?=$|,)‌​ - 逗号之间或字符串开头/结尾和逗号之间的任何空字符串。

【讨论】:

【参考方案2】:

你的表达有几个问题。

    第一个[\""] 是多余的,使用["] 或更好的"(没有 字符类)代替。 其次,您的实际问题是由于 + 运算符至少需要 一个 字符(但 逗号之间没有,因此不允许空字段)。 第三,这可能是一些CSV的输出,所以为什么不使用 explode() 或类似功能?


如果您坚持使用正则表达式,您可能会遇到:
".*?"|[^,]*

a demo on regex101.com

【讨论】:

【参考方案3】:

不确定是否有办法获取两个逗号之间的元素,因为它没有正则表达式。我能想到的最好的方法是:

str.match(/(?:[^,]+)|,,/g)

=> ["first", "last", ",,", "4443334444"]

但是您需要将“,,”翻译成一个空字符串。

您使用正则表达式是否有原因?你的语言有 .split() 函数吗? https://developer.mozilla.org/en-US/docs/Web/javascript/Reference/Global_Objects/String/split

【讨论】:

以上是关于使用正则表达式的逗号分隔字符串到数组的主要内容,如果未能解决你的问题,请参考以下文章

1 到 150 之间的有效字符串的正则表达式,以逗号和连字符分隔

如何使用正则表达式验证逗号分隔的字符串 [重复]

用于逗号分隔文本的 Mysql 正则表达式

通过正则表达式获取逗号分隔的数字

正则表达式从字符串中提取用逗号分隔的字符串

使用 pandas 正则表达式基于逗号字符分隔列数据