如何用单引号替换双引号 [关闭]
Posted
技术标签:
【中文标题】如何用单引号替换双引号 [关闭]【英文标题】:How To Replace a Double Set of Quotation Marks with a Single set of Quotation Marks [closed] 【发布时间】:2021-02-07 19:29:09 【问题描述】:我正在解析一些清单文件,需要先对它们进行清理,然后才能将它们作为 XML 加载。因此,这些文件是无效的 XML 文件。
考虑以下 sn-p:
<assemblyIdentity name=""Microsoft.Windows.Shell.DevicePairingFolder"" processorArchitecture=""amd64"" version=""5.1.0.0"" type="win32" />
有几个双引号实例,""
,我想用单引号替换,"
。
本质上,示例将转换为
<assemblyIdentity name="Microsoft.Windows.Shell.DevicePairingFolder" processorArchitecture="amd64" version="5.1.0.0" type="win32" />
我认为正则表达式是最好的方法,但这不是我的强项。
需要注意以下几点:
清单是一个多行字符串(本质上只是一个 XML 文档)processorArchitecture=""
之类的内容在文档中有效,因此为什么不适合使用简单的 string.Replace
调用。
【问题讨论】:
【参考方案1】:两种方式:
-
字符串替换
var newString = s.Replace("\"\"", "\"");
-
正则表达式。
string checkStringForDoubleQuotes = @"""";
string newString = Regex.Replace(s, checkStringForDoubleQuotes , @""");
更新后:
您的正则表达式是 https://regex101.com/r/xZUtUf/1/
""(?=\w)|(?<=\w)""
string s = "test=\"\" test2=\"\"assdasad\"\"";
string checkStringForDoubleQuotes = "\"\"(?=\\w)|(?<=\\w)\"\"";
string newString = Regex.Replace(s, checkStringForDoubleQuotes , "\"");
Console.WriteLine(newString);
// test="" test2="assdasad"
https://dotnetfiddle.net/FmWXUa
【讨论】:
对不起,我应该提到(提供示例的上下文)processorArchitecture=""
之类的内容在所述清单中有效,我不想将其更改为 processorArchitecture="
- 我将编辑发布以反映这一点
检查更新的代码。
抱歉上次更新,我错误地 c/p 解决方案。检查最新版本的工作示例。【参考方案2】:
使用
(\w+=)""(.*?)""(?=\s+\w+=|$)
替换为$1"$2"
。见proof。
说明
--------------------------------------------------------------------------------
( group and capture to \1:
--------------------------------------------------------------------------------
\w+ word characters (a-z, A-Z, 0-9, _) (1 or
more times (matching the most amount
possible))
--------------------------------------------------------------------------------
= '='
--------------------------------------------------------------------------------
) end of \1
--------------------------------------------------------------------------------
"" '""'
--------------------------------------------------------------------------------
( group and capture to \2:
--------------------------------------------------------------------------------
.*? any character except \n (0 or more times
(matching the least amount possible))
--------------------------------------------------------------------------------
) end of \2
--------------------------------------------------------------------------------
"" '""'
--------------------------------------------------------------------------------
(?= look ahead to see if there is:
--------------------------------------------------------------------------------
\s+ whitespace (\n, \r, \t, \f, and " ") (1
or more times (matching the most amount
possible))
--------------------------------------------------------------------------------
\w+ word characters (a-z, A-Z, 0-9, _) (1 or
more times (matching the most amount
possible))
--------------------------------------------------------------------------------
= '='
--------------------------------------------------------------------------------
| OR
--------------------------------------------------------------------------------
$ before an optional \n, and the end of
the string
--------------------------------------------------------------------------------
) end of look-ahead
C# example:
using System;
using System.Text.RegularExpressions;
public class Example
public static void Main()
string pattern = @"(\w+=)""""(.*?)""""(?=\s+\w+=|$)";
string substitution = @"$1""$2""";
string input = @"<assemblyIdentity name=""""Microsoft.Windows.Shell.DevicePairingFolder"""" processorArchitecture=""""amd64"""" version=""""5.1.0.0"""" type=""win32"" />";
Regex regex = new Regex(pattern);
string result = regex.Replace(input, substitution);
Console.Write(result);
【讨论】:
【参考方案3】:将引号使用十六进制转义符作为\x22
,使其更易于使用。这会将每个连续的""
替换为"
。
Regex.Replace(data, @"(\x22\x22)", "\x22")
【讨论】:
以上是关于如何用单引号替换双引号 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章