如何用单引号替换双引号 [关闭]

Posted

技术标签:

【中文标题】如何用单引号替换双引号 [关闭]【英文标题】:How To Replace a Double Set of Quotation Marks with a Single set of Quotation Marks [closed] 【发布时间】:2021-02-07 19:29:09 【问题描述】:

我正在解析一些清单文件,需要先对它们进行清理,然后才能将它们作为 XML 加载。因此,这些文件是无效的 XML 文件

考虑以下 sn-p:

<assemblyIdentity name=""Microsoft.Windows.Shell.DevicePairingFolder"" processorArchitecture=""amd64"" version=""5.1.0.0"" type="win32" />

有几个双引号实例,"",我想用单引号替换,"

本质上,示例将转换为

<assemblyIdentity name="Microsoft.Windows.Shell.DevicePairingFolder" processorArchitecture="amd64" version="5.1.0.0" type="win32" />

我认为正则表达式是最好的方法,但这不是我的强项。

需要注意以下几点:

清单是一个多行字符串(本质上只是一个 XML 文档) processorArchitecture="" 之类的内容在文档中有效,因此为什么不适合使用简单的 string.Replace 调用。

【问题讨论】:

【参考方案1】:

两种方式:

    字符串替换
var newString = s.Replace("\"\"", "\"");
    正则表达式。
string checkStringForDoubleQuotes = @"""";
string newString  = Regex.Replace(s, checkStringForDoubleQuotes , @""");

更新后:

您的正则表达式是 https://regex101.com/r/xZUtUf/1/

""(?=\w)|(?<=\w)""
string s = "test=\"\" test2=\"\"assdasad\"\"";
string checkStringForDoubleQuotes = "\"\"(?=\\w)|(?<=\\w)\"\"";
string newString  = Regex.Replace(s, checkStringForDoubleQuotes , "\"");
Console.WriteLine(newString);
// test="" test2="assdasad"

https://dotnetfiddle.net/FmWXUa

【讨论】:

对不起,我应该提到(提供示例的上下文)processorArchitecture="" 之类的内容在所述清单中有效,我不想将其更改为 processorArchitecture=" - 我将编辑发布以反映这一点 检查更新的代码。 抱歉上次更新,我错误地 c/p 解决方案。检查最新版本的工作示例。【参考方案2】:

使用

(\w+=)""(.*?)""(?=\s+\w+=|$)

替换为$1"$2"。见proof。

说明

--------------------------------------------------------------------------------
  (                        group and capture to \1:
--------------------------------------------------------------------------------
    \w+                      word characters (a-z, A-Z, 0-9, _) (1 or
                             more times (matching the most amount
                             possible))
--------------------------------------------------------------------------------
    =                        '='
--------------------------------------------------------------------------------
  )                        end of \1
--------------------------------------------------------------------------------
  ""                       '""'
--------------------------------------------------------------------------------
  (                        group and capture to \2:
--------------------------------------------------------------------------------
    .*?                      any character except \n (0 or more times
                             (matching the least amount possible))
--------------------------------------------------------------------------------
  )                        end of \2
--------------------------------------------------------------------------------
  ""                       '""'
--------------------------------------------------------------------------------
  (?=                      look ahead to see if there is:
--------------------------------------------------------------------------------
    \s+                      whitespace (\n, \r, \t, \f, and " ") (1
                             or more times (matching the most amount
                             possible))
--------------------------------------------------------------------------------
    \w+                      word characters (a-z, A-Z, 0-9, _) (1 or
                             more times (matching the most amount
                             possible))
--------------------------------------------------------------------------------
    =                        '='
--------------------------------------------------------------------------------
   |                        OR
--------------------------------------------------------------------------------
    $                        before an optional \n, and the end of
                             the string
--------------------------------------------------------------------------------
  )                        end of look-ahead

C# example:

using System;
using System.Text.RegularExpressions;

public class Example

    public static void Main()
    
        string pattern = @"(\w+=)""""(.*?)""""(?=\s+\w+=|$)";
        string substitution = @"$1""$2""";
        string input = @"<assemblyIdentity name=""""Microsoft.Windows.Shell.DevicePairingFolder"""" processorArchitecture=""""amd64"""" version=""""5.1.0.0"""" type=""win32"" />";
        
        Regex regex = new Regex(pattern);
        string result = regex.Replace(input, substitution);
        Console.Write(result);
    

【讨论】:

【参考方案3】:

将引号使用十六进制转义符作为\x22,使其更易于使用。这会将每个连续的"" 替换为"

 Regex.Replace(data, @"(\x22\x22)", "\x22")

【讨论】:

以上是关于如何用单引号替换双引号 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

PHP 替换html标签内的单引号,将单引号替换成双引号

如何用sql语句插入一个带有单引号的值

用 \' 或 \" 替换每个单引号/双引号

如何用 sed 的变量替换单引号字符串? [复制]

shell中对于单引号,双引号和反引号的处理方式

python中如何输出引号