如何处理 JSON 中的换行符?
Posted
技术标签:
【中文标题】如何处理 JSON 中的换行符?【英文标题】:How do I handle newlines in JSON? 【发布时间】:2010-09-07 17:02:35 【问题描述】:我已经生成了一些 JSON,我正在尝试将其拉入 javascript 中的对象中。我不断收到错误。这是我所拥有的:
var data = '"count" : 1, "stack" : "sometext\n\n"';
var dataObj = eval('('+data+')');
这给了我一个错误:
unterminated string literal
使用JSON.parse(data)
,我会看到类似的错误消息:Chrome 中的“Unexpected token ↵
”和 Firefox 和 IE 中的“unterminated string literal
”。
当我在sometext
之后取出\n
时,两种情况下的错误都会消失。我似乎无法弄清楚为什么\n
使eval
和JSON.parse
失败。
【问题讨论】:
尝试使用真正的 json 解析器而不是 eval。 想提一下,至少对于 c#.net 来说,在服务器端转义字符对我们不起作用(我猜它们会被序列化层无法转义)。为我们做到这一点的诀窍是在 CLIENT 上执行转义。 【参考方案1】:TLDR:作者问题的解决方案。
使用String.raw
字面量:
var data = String.raw`"count" : 1, "stack" : "sometext\n\n"`;
出于某种原因,这里的所有答案都集中在如何在 JavaScript 中解析 JSON 字符串表示,这可能会导致关于如何在实际 JSON 上表示换行符的混淆。后者不依赖于语言。
严格根据题名:
如何处理 JSON 中的换行符?
假设您使用node
中的以下代码解析一个 JSON 文件(尽管它可以是任何语言):
let obj = JSON.parse(fs.readFileSync('file.json'));
console.log(obj.mykey)
以下是file.json
的每个可能内容的输出:
输入 1:
"mykey": "my multiline
value"
输出 1:
SyntaxError: Unexpected token
输入 2:
"mykey": "my multiline\nvalue"
输出 2:
my multiline
value
输入 3:
"mykey": "my multiline\\nvalue"
输出 3:
my multiline\nvalue
结论一:
要在json
文件中表示换行符,我们应该使用\n
字符。要表示\n
,我们应该使用\\n
。
我们将如何使用 JavaScript(而不是输入文件)定义上述每个输入:
当我们需要在 JavaScript 中定义一个包含 JSON 的字符串时,事情会发生一些变化,因为 \n
对于 JavaScript 也有特殊含义。 但还要注意 String.raw
字面量是如何解决这个问题的。
输入 1:
let input1 = '"mykey": "my multiline\nvalue"'
//OR
let input1 = `
"mykey": "my multiline
value"
`;
//OR
let input1 = String.raw`
"mykey": "my multiline
value"
`;
console.log(JSON.parse(input1).mykey);
//SyntaxError: Unexpected token
//in JSON at position [..]
输入 2:
let input2 = '"mykey": "my multiline\\nvalue"'
//OR
let input2 = `
"mykey": "my multiline\\nvalue"
`;
//OR (Notice the difference from default literal)
let input2 = String.raw`
"mykey": "my multiline\nvalue"
`;
console.log(JSON.parse(input2).mykey);
//my multiline
//value
输入 3:
let input3 = '"mykey": "my multiline\\\\nvalue"'
//OR
let input3 = `
"mykey": "my multiline\\\\nvalue"
`;
//OR (Notice the difference from default literal)
let input3 = String.raw`
"mykey": "my multiline\\nvalue"
`;
console.log(JSON.parse(input3).mykey);
//my multiline\nvalue
结论二:
要在javascript中定义json
字符串,最简单的方法是使用String.raw
,因为它不需要任何转义(除了像String.raw`abc$"`"def`
这样转义的反引号之外)。
当然,在javascript中创建json
最简单的方法,一般来说,就是将一个javascript对象转换成json(使用JSON.stringify
)。
【讨论】:
这是真的,但是正如@jerryurenaa 指出的那样,您需要在显示 json 的任何位置处理空格。 @tfantina 作者的问题是关于解析的。渲染是另一回事。解析 json 可能在没有 html 视图可用的上下文中。我想在我的回答中指出的是,在纯 json 换行符中表示如下:\n
(按规范),而在 javascript 字符串定义中,json 换行符需要转义:\\n
。最后,换行字节不是字符串类型的 json 值中的有效字符。
这个答案解释了如何处理 .json
文件中的新行。虽然这不是 OP 问题的答案,但很多使用 .json 文件的人都在这里登陆【参考方案2】:
这就是你想要的:
var data = '"count" : 1, "stack" : "sometext\\n\\n"';
您需要将字符串中的\
转义(将其转换为双\
),否则它将成为JSON 源中的换行符,而不是JSON 数据。
【讨论】:
这当然是正确的,但我想补充一下必须这样做的原因:ietf.org/rfc/rfc4627.txt 的 JSON 规范在第 2.5 节中包含这句话:“所有 Unicode 字符都可以放置引号内,但必须转义的字符除外:引号、反斜线和控制字符(U+0000 到 U+001F)。”由于换行符是控制字符,因此必须对其进行转义。 根据 www.json.org JSON 确实接受字符串中的控制序列 "\n" - 如果您尝试 JSON.parse(['"a\\na"'])[1] .charCodeAt();这将显示 10 - 这是我上次检查时的“换行符”。 --- 顺便说一句:停止尖叫! + 1. 我无法理解 JSON 编码,但“将成为 JSON 源中的换行符,而不是 JSON 数据”让我明白了。 人们可能认为转义\n
就是转义\(不知道如何在行中引用\...)为\\ 加上n
。实际上,\n
是一个控制字符,表示为\u000A
作为一个unicode 点。 "\n"
与 "\u000A"
完全相同。所以转义\n
就是转义\u000A
。它的转义形式是\n
,我们应该在Javascript字符串中将\写成\\,这就是为什么"\\n"
是正确答案的原因。对于 powershell,`
而不是 \ 是转义字符。换行符表示为`n
。 ConvertTo-Json "`n"
将得到"\n"
,ConvertFrom-Json ‘"Line 1\nLine 2"’
将得到Line 1
和Line 2
,分两行。【参考方案3】:
好吧,当它可以通过 1 个 CSS 类来完成时,实际上并没有必要为此创建一个函数。
只需将您的文本包裹在这个类周围,看看它的魔力:D
<p style=whiteSpace: 'pre-line'>my json text goes here \n\n</p>
注意:因为您将始终使用 HTML 在前端显示文本,您可以将 style=whiteSpace: 'pre-line' 添加到任何标签,而不仅仅是 p 标签。
【讨论】:
【参考方案4】:根据规范,http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf:
字符串是用引号括起来的 Unicode 代码点序列 (
U+0022
)。所有字符都可以放在引号内,除了 必须转义的字符:引号 (U+0022
)、反斜线 (U+005C
),以及控制字符U+0000
到U+001F
。有二字 某些字符的转义序列表示。
所以你不能直接传递0x0A
或0x0C
代码。这是被禁止的!规范建议对从U+0000
到U+001F
的一些定义明确的代码使用转义序列:
\f
代表换页符 (U+000C
)。
\n
代表换行符 (U+000A
)。
由于大多数编程语言使用 \
进行引用,您应该转义转义语法(双转义 - 一次用于语言/平台,一次用于 JSON 本身):
jsonStr = " \"name\": \"Multi\\nline.\" ";
【讨论】:
在 JSON 文件本身中,您似乎可以/应该使用 \n,而不是 \\n,因为在 ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf 它说:“某些字符有两个字符的转义序列表示...... . \r 代表回车符(U+000D)..."【参考方案5】:例如,您可以在写入 JSON 字段的值时在服务器上转义字符串,并在客户端浏览器中检索值时取消转义。
所有主流浏览器的 JavaScript 实现都有 unescape 命令。
例子:
在服务器上:
response.write """field1"":""" & escape(RS_Temp("textField")) & """"
在浏览器中:
document.getElementById("text1").value = unescape(jsonObject.field1)
【讨论】:
【参考方案6】:我使用这个函数去除数据中的换行符或其他字符来解析 JSON 数据:
function normalize_str($str)
$invalid = array(
'Š'=>'S', 'š'=>'s', 'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
'Č'=>'C', 'č'=>'c', 'Ć'=>'C', 'ć'=>'c', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
'ÿ'=>'y', 'Ŕ'=>'R', 'ŕ'=>'r',
"`" => "'", "´" => "'", '"' => ',', '`' => "'",
'´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
"’" => "'",
"" => "",
"~" => "", "–" => "-", "'" => "'", " " => " ");
$str = str_replace(array_keys($invalid), array_values($invalid), $str);
$remove = array("\n", "\r\n", "\r");
$str = str_replace($remove, "\\n", trim($str));
//$str = htmlentities($str, ENT_QUOTES);
return htmlspecialchars($str);
echo normalize_str($lst['address']);
【讨论】:
在大多数语言中,从 unicode 字符串中去除重音符号的方法比编写自己的映射函数更好。有关 python 中的示例,请参阅此问题:***.com/questions/517923/… 是的,我们有很多方法可以控制差异语言中的特殊字符。 一般来说剥离它们有点糟糕。更好地将它们编码为 XML 数字字符引用,然后在接收端解码。【参考方案7】:我在 php 4 中创建一个类来模拟 json_encode(在 PHP 5 中可用)时遇到了这个问题。这是我想出的:
class jsonResponse
var $response;
function jsonResponse()
$this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
function set($isOK, $msg)
$this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
$this->response['msg'] = htmlentities($msg);
function setData($data=null)
if(!is_null($data))
$this->response['data'] = $data;
elseif(isset($this->response['data']))
unset($this->response['data']);
function send()
header('Content-type: application/json');
echo '"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
if(isset($this->response['data']))
echo ',"data":' . $this->parseData($this->response['data']);
echo '';
function parseData($data)
if(is_array($data))
$parsed = array();
foreach ($data as $key=>$value)
array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
return '' . implode(',', $parsed) . '';
else
return $this->parseString($data);
function parseString($string)
$string = str_replace("\\", "\\\\", $string);
$string = str_replace('/', "\\/", $string);
$string = str_replace('"', "\\".'"', $string);
$string = str_replace("\b", "\\b", $string);
$string = str_replace("\t", "\\t", $string);
$string = str_replace("\n", "\\n", $string);
$string = str_replace("\f", "\\f", $string);
$string = str_replace("\r", "\\r", $string);
$string = str_replace("\u", "\\u", $string);
return '"'.$string.'"';
我遵循了here 中提到的规则。我只使用了我需要的东西,但我认为你可以用你使用的语言来适应你的需要。就我而言,问题不在于我最初认为的换行符,而在于 / 没有被转义。我希望这可以防止其他人因为我弄清楚我做错了什么而感到头疼。
【讨论】:
json.org 上指定的控制字符的 6 个简写并不是所有控制字符的详尽列表。因此,此函数可能会生成无效的 JSON。【参考方案8】:据我了解您的问题,这与解析 JSON 无关,因为您可以直接将 JSON 复制粘贴到您的代码中 - 所以如果是这种情况,那么只需将您的 JSON 直接复制到 dataObj
变量而不用单个包装引号(提示:eval==evil
)
var dataObj = "count" : 1, "stack" : "sometext\n\n";
console.log(dataObj);
【讨论】:
【参考方案9】:如果data
不是字符串文字,您将需要一个将\n
替换为\\n
的函数。
function jsonEscape(str)
return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
var data = '"count" : 1, "stack" : "sometext\n\n"';
var dataObj = JSON.parse(jsonEscape(data));
生成的dataObj
将是
Object count: 1, stack: "sometext\n\n"
【讨论】:
您需要转义转义字符(即.replace("\\n", "\\\\n")
),我还建议使用正则表达式来允许替换多个实例(即.replace(/\n/g, "\\\\n")
)
为什么需要转义字符?我的意思是像.replace("\n", "\\n")
这样的东西应该可以很好地完成工作!!例如,var test = ["description":"Some description about the product. This can be multi-line text."]; console.log(JSON.parse(test.replace(/\n/g, "\\n")));
会将对象完美地输出到浏览器控制台为["description":"Some description about the product.\nThis can be multi-line text."]
顺便说一句,在上面的注释中,原始 JSON 字符串有一个新行,它被 *** 的注释格式化程序删除。你可以看到替换后的最终输出应该插入一个换行符 \n
在值中。
-1 这个答案首先构造了一个无效的 JSON 字符串(因为换行符是一个控制字符),然后尝试用一系列不完整的替换来修复它(控制字符超过 3 个)。然后最重要的是,它还设法使用eval
函数。 17 票赞成???
引号也需要转义怎么办?【参考方案10】:
您可能想查看这个 C# 函数来转义字符串:
http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx
public static string Enquote(string s)
if (s == null || s.Length == 0)
return "\"\"";
char c;
int i;
int len = s.Length;
StringBuilder sb = new StringBuilder(len + 4);
string t;
sb.Append('"');
for (i = 0; i < len; i += 1)
c = s[i];
if ((c == '\\') || (c == '"') || (c == '>'))
sb.Append('\\');
sb.Append(c);
else if (c == '\b')
sb.Append("\\b");
else if (c == '\t')
sb.Append("\\t");
else if (c == '\n')
sb.Append("\\n");
else if (c == '\f')
sb.Append("\\f");
else if (c == '\r')
sb.Append("\\r");
else
if (c < ' ')
//t = "000" + Integer.toHexString(c);
string t = new string(c,1);
t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber);
sb.Append("\\u" + t.Substring(t.Length - 4));
else
sb.Append(c);
sb.Append('"');
return sb.ToString();
【讨论】:
为什么会转义>
?以上是关于如何处理 JSON 中的换行符?的主要内容,如果未能解决你的问题,请参考以下文章
[100 Tips About Shell] Shell中是如何处理换行符的
Python:使用正则表达式爬虫如何处理HTML代码中的换行?
Python:使用正则表达式爬虫如何处理HTML代码中的换行?