将 SQL 插入脚本转换为 CSV 格式

Posted

技术标签:

【中文标题】将 SQL 插入脚本转换为 CSV 格式【英文标题】:Transform SQL insert script into CSV format 【发布时间】:2015-11-08 16:10:38 【问题描述】:

我正在寻找 awk 命令或类似工具,将标准格式良好的 SQL 插入脚本转换为 csv 文件。 按照标准,我的意思是任何地方都没有数据库供应商特定的东西。 格式良好是指 sql 脚本的每一行都有一个完整的列集插入的情况,即使有 NULL 也是如此。此外,要插入的字段顺序也是相同的。 示例输入 SQL 脚本:

INSERT INTO tbl VALUES (1, 'asd', 923123123, 'zx');
INSERT INTO tbl VALUES (1, NULL, 923123123, 'zxz');
INSERT INTO tbl VALUES (3, 'asd3', 923123123, NULL);

可选:

INSERT INTO tbl (colA, colB, colC, colD) VALUES (1, 'asd', 923123123, 'zx');

预期的输出应该是一个 csv 文件:

1,'asd',923123123,'zx'
1,,923123123,'zxz'
3,'asd3',923123123,

寻找性能高效的解决方案。

【问题讨论】:

csv 实际上是邪恶的。如果文本数据从不包含单引号(aka tick = '),那么我猜它没问题。其他要添加的测试用例包括模拟通用名称和地址数据:INSERT INTO tbl VALUES (1, NULL, 923123123, 'foo'' bar');插入 tbl 值 (1, NULL, 923123123, 'foo , bar');插入 tbl 值 (1, NULL, 923123123, 'foo ,'', bar'); csv 是最广泛使用的数据交换格式,如果它是邪恶的,它仍然是我们必须理解的。如果你有不错的工具将数据提取到 csv,那么你会很好。 【参考方案1】:

用 GNU grep 和 sed 试试这个:

grep -oP '\(\K[^)]*(?=\);)' file | sed 's/NULL//g;s/ //g'

所有四行的输出:

1,'asd',923123123,'zx' 1,,923123123,'zxz' 3,'asd3',923123123, 1,'asd',923123123,'zx'

或仅使用 GNU sed:

sed 's/.*(\([^)]*\));/\1/;s/NULL//g;s/ //g' file

所有四行的输出:

1,'asd',923123123,'zx' 1,,923123123,'zxz' 3,'asd3',923123123, 1,'asd',923123123,'zx'

【讨论】:

这些都不会检查单词 NULL 是它自己的字段而不是字段的一部分,因此它将删除文字字符串中的 NULL,并且它还会删除所有空格,包括文字字符串中的空格.【参考方案2】:
$ awk -F' *[(),]+ *' -v OFS=, 'for (i=2;i<NF;i++) printf "%s%s", ($i=="NULL"?"":$i), (i<(NF-1)?OFS:ORS)' file
1,'asd',923123123,'zx'
1,,923123123,'zxz'
3,'asd3',923123123,

我建议您使用此输入测试所有可能的解决方案:

$ cat file
INSERT INTO tbl VALUES (1, NULL, 923123123, 'foo NULL bar');

$ awk -F' *[(),]+ *' -v OFS=, 'for (i=2;i<NF;i++) printf "%s%s", ($i=="NULL"?"":$i), (i<(NF-1)?OFS:ORS)' file
1,,923123123,'foo NULL bar'

确保字符串NULL 和空白字符在作为文字字符串的一部分出现时不会被删除。

【讨论】:

【参考方案3】:
awk -F'[()]' -v OFS=, 'gsub(/NULL|;/,"")gsub(/, /,",")print $(NF -1)' file
1,'asd',923123123,'zx'
1,,923123123,'zxz'
3,'asd3',923123123,

【讨论】:

以上是关于将 SQL 插入脚本转换为 CSV 格式的主要内容,如果未能解决你的问题,请参考以下文章

如何在谷歌脚本中将文本作为日期插入单元格? (符合时区转换)

如何在数字中插入小数

用于将日期和时间列转换为 .csv 中的 unix 时间戳的 Bash 脚本

批量插入、SQL Server 2000、unix 换行符

如何将特殊字符插入 Advantage SQL 数据库?

Excel/CSV - 如何停止 excel 自动将字符串格式化为日期