如何处理 JSON 中的换行符?

Posted

技术标签:

【中文标题】如何处理 JSON 中的换行符?【英文标题】:How do I handle newlines in JSON? 【发布时间】:2010-09-07 17:02:35 【问题描述】:

我已经生成了一些 JSON,我正在尝试将其拉入 javascript 中的对象中。我不断收到错误。这是我所拥有的:

var data = '"count" : 1, "stack" : "sometext\n\n"';
var dataObj = eval('('+data+')');

这给了我一个错误:

unterminated string literal

使用JSON.parse(data),我会看到类似的错误消息:Chrome 中的“Unexpected token ↵”和 Firefox 和 IE 中的“unterminated string literal”。

当我在sometext 之后取出\n 时,两种情况下的错误都会消失。我似乎无法弄清楚为什么\n 使evalJSON.parse 失败。

【问题讨论】:

尝试使用真正的 json 解析器而不是 eval。 想提一下,至少对于 c#.net 来说,在服务器端转义字符对我们不起作用(我猜它们会被序列化层无法转义)。为我们做到这一点的诀窍是在 CLIENT 上执行转义。 【参考方案1】:

TLDR:作者问题的解决方案。

使用String.raw字面量:

var data = String.raw`"count" : 1, "stack" : "sometext\n\n"`;

出于某种原因,这里的所有答案都集中在如何在 JavaScript 中解析 JSON 字符串表示,这可能会导致关于如何在实际 JSON 上表示换行符的混淆。后者不依赖于语言。

严格根据题名:

如何处理 JSON 中的换行符?

假设您使用node 中的以下代码解析一个 JSON 文件(尽管它可以是任何语言):


let obj = JSON.parse(fs.readFileSync('file.json'));
console.log(obj.mykey)

以下是file.json 的每个可能内容的输出:

输入 1:


  "mykey": "my multiline
   value"

输出 1:

SyntaxError: Unexpected token

输入 2:


  "mykey": "my multiline\nvalue"

输出 2:

my multiline
value

输入 3:


  "mykey": "my multiline\\nvalue"

输出 3:

my multiline\nvalue

结论一:

要在json 文件中表示换行符,我们应该使用\n 字符。要表示\n,我们应该使用\\n


我们将如何使用 JavaScript(而不是输入文件)定义上述每个输入:

当我们需要在 JavaScript 中定义一个包含 JSON 的字符串时,事情会发生一些变化,因为 \n 对于 JavaScript 也有特殊含义。 但还要注意 String.raw 字面量是如何解决这个问题的

输入 1:

let input1 = '"mykey": "my multiline\nvalue"'

//OR
let input1 = `
  "mykey": "my multiline
   value"
`;

//OR
let input1 = String.raw`
  "mykey": "my multiline
   value"
`;

console.log(JSON.parse(input1).mykey);

//SyntaxError: Unexpected token
//in JSON at position [..]

输入 2:

let input2 = '"mykey": "my multiline\\nvalue"'

//OR
let input2 = `
  "mykey": "my multiline\\nvalue"
`;

//OR (Notice the difference from default literal)
let input2 = String.raw`
  "mykey": "my multiline\nvalue"
`;

console.log(JSON.parse(input2).mykey);

//my multiline
//value

输入 3

let input3 = '"mykey": "my multiline\\\\nvalue"'

//OR
let input3 = `
  "mykey": "my multiline\\\\nvalue"
`;

//OR (Notice the difference from default literal)
let input3 = String.raw`
  "mykey": "my multiline\\nvalue"
`;

console.log(JSON.parse(input3).mykey);

//my multiline\nvalue

结论二:

要在javascript中定义json字符串,最简单的方法是使用String.raw,因为它不需要任何转义(除了像String.raw`abc$"`"def` 这样转义的反引号之外)。

当然,在javascript中创建json最简单的方法,一般来说,就是将一个javascript对象转换成json(使用JSON.stringify)。

【讨论】:

这是真的,但是正如@jerryurenaa 指出的那样,您需要在显示 json 的任何位置处理空格。 @tfantina 作者的问题是关于解析的。渲染是另一回事。解析 json 可能在没有 html 视图可用的上下文中。我想在我的回答中指出的是,在纯 json 换行符中表示如下:\n(按规范),而在 javascript 字符串定义中,json 换行符需要转义:\\n。最后,换行字节不是字符串类型的 json 值中的有效字符。 这个答案解释了如何处理 .json 文件中的新行。虽然这不是 OP 问题的答案,但很多使用 .json 文件的人都在这里登陆【参考方案2】:

这就是你想要的:

var data = '"count" : 1, "stack" : "sometext\\n\\n"';

您需要将字符串中的\ 转义(将其转换为双\),否则它将成为JSON 源中的换行符,而不是JSON 数据。

【讨论】:

这当然是正确的,但我想补充一下必须这样做的原因:ietf.org/rfc/rfc4627.txt 的 JSON 规范在第 2.5 节中包含这句话:“所有 Unicode 字符都可以放置引号内,但必须转义的字符除外:引号、反斜线和控制字符(U+0000 到 U+001F)。”由于换行符是控制字符,因此必须对其进行转义。 根据 www.json.org JSON 确实接受字符串中的控制序列 "\n" - 如果您尝试 JSON.parse(['"a\\na"'])[1] .charCodeAt();这将显示 10 - 这是我上次检查时的“换行符”。 --- 顺便说一句:停止尖叫! + 1. 我无法理解 JSON 编码,但“将成为 JSON 源中的换行符,而不是 JSON 数据”让我明白了。 人们可能认为转义\n 就是转义\(不知道如何在行中引用\...)为\\ 加上n。实际上,\n 是一个控制字符,表示为\u000A 作为一个unicode 点。 "\n""\u000A" 完全相同。所以转义\n 就是转义\u000A。它的转义形式是\n,我们应该在Javascript字符串中将\写成\\,这就是为什么"\\n"是正确答案的原因。对于 powershell,` 而不是 \ 是转义字符。换行符表示为`nConvertTo-Json "`n" 将得到"\n"ConvertFrom-Json ‘"Line 1\nLine 2"’ 将得到Line 1Line 2,分两行。【参考方案3】:

好吧,当它可以通过 1 个 CSS 类来完成时,实际上并没有必要为此创建一个函数。

只需将您的文本包裹在这个类周围,看看它的魔力:D

 <p style=whiteSpace: 'pre-line'>my json text goes here \n\n</p>

注意:因为您将始终使用 HTML 在前端显示文本,您可以将 style=whiteSpace: 'pre-line' 添加到任何标签,而不仅仅是 p 标签。

【讨论】:

【参考方案4】:

根据规范,http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf:

字符串是用引号括起来的 Unicode 代码点序列 (U+0022)。所有字符都可以放在引号内,除了 必须转义的字符:引号 (U+0022)、反斜线 (U+005C),以及控制字符 U+0000U+001F。有二字 某些字符的转义序列表示。

所以你不能直接传递0x0A0x0C 代码。这是被禁止的!规范建议对从U+0000U+001F 的一些定义明确的代码使用转义序列:

\f 代表换页符 (U+000C)。 \n 代表换行符 (U+000A)。

由于大多数编程语言使用 \ 进行引用,您应该转义转义语法(双转义 - 一次用于语言/平台,一次用于 JSON 本身):

jsonStr = " \"name\": \"Multi\\nline.\" ";

【讨论】:

在 JSON 文件本身中,您似乎可以/应该使用 \n,而不是 \\n,因为在 ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf 它说:“某些字符有两个字符的转义序列表示...... . \r 代表回车符(U+000D)..."【参考方案5】:

例如,您可以在写入 JSON 字段的值时在服务器上转义字符串,并在客户端浏览器中检索值时取消转义。

所有主流浏览器的 JavaScript 实现都有 unescape 命令。

例子:

在服务器上:

response.write """field1"":""" & escape(RS_Temp("textField")) & """"

在浏览器中:

document.getElementById("text1").value = unescape(jsonObject.field1)

【讨论】:

【参考方案6】:

我使用这个函数去除数据中的换行符或其他字符来解析 JSON 数据:

function normalize_str($str) 

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);


echo normalize_str($lst['address']);

【讨论】:

在大多数语言中,从 unicode 字符串中去除重音符号的方法比编写自己的映射函数更好。有关 python 中的示例,请参阅此问题:***.com/questions/517923/… 是的,我们有很多方法可以控制差异语言中的特殊字符。 一般来说剥离它们有点糟糕。更好地将它们编码为 XML 数字字符引用,然后在接收端解码。【参考方案7】:

我在 php 4 中创建一个类来模拟 json_encode(在 PHP 5 中可用)时遇到了这个问题。这是我想出的:

class jsonResponse 
    var $response;

    function jsonResponse() 
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    

    function set($isOK, $msg) 
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    

    function setData($data=null) 
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    

    function send() 
        header('Content-type: application/json');
        echo '"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '';
    

    function parseData($data) 
        if(is_array($data)) 
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '' . implode(',', $parsed) . '';
        
        else
            return $this->parseString($data);
    

    function parseString($string) 
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    

我遵循了here 中提到的规则。我只使用了我需要的东西,但我认为你可以用你使用的语言来适应你的需要。就我而言,问题不在于我最初认为的换行符,而在于 / 没有被转义。我希望这可以防止其他人因为我弄清楚我做错了什么而感到头疼。

【讨论】:

json.org 上指定的控制字符的 6 个简写并不是所有控制字符的详尽列表。因此,此函数可能会生成无效的 JSON。【参考方案8】:

据我了解您的问题,这与解析 JSON 无关,因为您可以直接将 JSON 复制粘贴到您的代码中 - 所以如果是这种情况,那么只需将您的 JSON 直接复制到 dataObj 变量而不用单个包装引号(提示:eval==evil

var dataObj = "count" : 1, "stack" : "sometext\n\n";

console.log(dataObj);

【讨论】:

【参考方案9】:

如果data 不是字符串文字,您将需要一个将\n 替换为\\n 的函数。

function jsonEscape(str)  
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");


var data = '"count" : 1, "stack" : "sometext\n\n"';
var dataObj = JSON.parse(jsonEscape(data));

生成的dataObj 将是

Object count: 1, stack: "sometext\n\n"

【讨论】:

您需要转义转义字符(即.replace("\\n", "\\\\n")),我还建议使用正则表达式来允许替换多个实例(即.replace(/\n/g, "\\\\n") 为什么需要转义字符?我的意思是像.replace("\n", "\\n") 这样的东西应该可以很好地完成工作!!例如,var test = ["description":"Some description about the product. This can be multi-line text."]; console.log(JSON.parse(test.replace(/\n/g, "\\n"))); 会将对象完美地输出到浏览器控制台为["description":"Some description about the product.\nThis can be multi-line text."] 顺便说一句,在上面的注释中,原始 JSON 字符串有一个新行,它被 *** 的注释格式化程序删除。你可以看到替换后的最终输出应该插入一个换行符 \n在值中。 -1 这个答案首先构造了一个无效的 JSON 字符串(因为换行符是一个控制字符),然后尝试用一系列不完整的替换来修复它(控制字符超过 3 个)。然后最重要的是,它还设法使用eval 函数。 17 票赞成??? 引号也需要转义怎么办?【参考方案10】:

您可能想查看这个 C# 函数来转义字符串:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
 
    if (s == null || s.Length == 0)  
     
        return "\"\""; 
     
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
     
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
         
            sb.Append('\\'); 
            sb.Append(c); 
         
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
         
            if (c < ' ')  
             
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
              
            else  
             
                sb.Append(c); 
             
         
     
    sb.Append('"'); 
    return sb.ToString(); 
 

【讨论】:

为什么会转义&gt;

以上是关于如何处理 JSON 中的换行符?的主要内容,如果未能解决你的问题,请参考以下文章

[100 Tips About Shell] Shell中是如何处理换行符的

Python:使用正则表达式爬虫如何处理HTML代码中的换行?

Python:使用正则表达式爬虫如何处理HTML代码中的换行?

Vim:在寄存器中存储多个命令时如何处理换行符?

wx.request得到的正文字段如何处理成符合JSON格式的

手动创建编写bat文件来操作mysql,如何处理换行