系统运维系列 之CSV文件读取时内容中包含逗号的处理方法
Posted 琅晓琳
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了系统运维系列 之CSV文件读取时内容中包含逗号的处理方法相关的知识,希望对你有一定的参考价值。
问题描述:
CSV文件默认逗号分隔,但是如果在内容中包含逗号,则会导致分隔失败或者数组下标匹配越界的问题。
处理方法:
(1)正则表达式
//(?=pattern)
//非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用
//(?:pattern)
//非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式
//分割没有被双引号扩住的逗号
line.split(",(?=([^\\"]*\\"[^\\"]*\\")*[^\\"]*$)")
(2)使用第三方jar
<dependency>
<groupId>com.opencsv</groupId>
<artifactId>opencsv</artifactId>
<version>4.4</version>
</dependency>
参考资料:
https://blog.csdn.net/wls_2019/article/details/123225335 csv文件读写中的特殊情况(逗号)
https://www.cnblogs.com/allen2333/p/9835654.html 正则表达式 - (?!), (?😃, (?=)
https://blog.csdn.net/superbeyone/article/details/83624241 Java读取CSV文件(CSV文件数据内容包含逗号处理)
以上是关于系统运维系列 之CSV文件读取时内容中包含逗号的处理方法的主要内容,如果未能解决你的问题,请参考以下文章