C#读取Excel中嵌套的Json对象,Json带斜杠的问题(其一)

Posted 霍莉雪特

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C#读取Excel中嵌套的Json对象,Json带斜杠的问题(其一)相关的知识,希望对你有一定的参考价值。

策划填Excel表时,约定对于复杂类型的数据采用Json的格式填写。如下图,D列的内容是Json数据。

单元格中的Json如下。

{
    "name": "BeJson2",
    "url": "http://www.bejson.com",
    "page": 88,
    "isNonProfit": true,
    "address": {
        "street": "科技园路.",
        "city": "江苏苏州",
        "country": "中国"
    },
    "links": [{
        "name": "Google",
        "url": "http://www.google.com"
    }, {
        "name": "Baidu",
        "url": "http://www.baidu.com"
    }, {
        "name": "SoSo",
        "url": "http://www.SoSo.com"
    }]
}

择使用ExcelDataReader这个库读Excel时,对于单元格是Json字符串的情况,读取得到的Json会把这段嵌套的Json转为带斜杠(转义符)的字符串,类似下图的情况。

问题来了:这种字符串已经不再是Json格式了,用Newtonsoft.json库无法正确反序列化它。

办法:一种解决办法是在序列化Json时,就用一个C#类作为参照。通过反射C#类中对应属性的类型,来判断这个Json单元格对应的C#类(而不是string字符串)。

对于上面嵌套的Json,可以用C#类来描述如下。

public class User
{
    public string id { get; set; }
    public string name { get; set; }
    public string attribute { get; set; }
    public string ttr { get; set; }

    public UserConfig user_config { get; set; }
}

public class UserConfig
{
    public string Name { get; set; }
    public string url { get; set; }
    public int page { get; set; }
    public bool isNonProfit { get; set; }
    public Address address { get; set; }
    public Links[] links { get; set; }
}

public class Address
{
    public string street { get; set; }
    public string city { get; set; }
    public string country { get; set; }
}

public class Links
{
    public string name { get; set; }
    public string url { get; set; }
}

C#代码在序列化Json时,就判断每个单元格cell中的内容的类型,把嵌套的Json强转为对应C#的class类型,不能让它保持是string输出。

反射C#类并做判断的关键代码类似下面这样的:

// 存储一行Row数据。key是表头属性字段,value是单元格内容。
Dictionary<string, object> row = new Dictionary<string, object>();

Type fieldType = propertyInfo.PropertyType;
if (fieldType.IsPrimitive && fieldType.IsValueType)
{
    int value = int.Parse(cell.ToString()); // 值类型,如int等数值(约定不用枚举)
    row[field] = value;
}
else if (fieldType == typeof(string))
{
    row[field] = cell.ToString(); // string
}
else if (fieldType.IsClass)
{
    object obj = JsonConvert.DeserializeObject(cell.ToString()); // object
    row[field] = obj;
}

这样导出的嵌套Json就不带斜杠了。因为它在输出时不在是string类型,而是object了。

缺点是序列化Json阶段就需要C#类(正常来说是反序列化时才需要的),反射C#造成的性能效率问题。

以上是关于C#读取Excel中嵌套的Json对象,Json带斜杠的问题(其一)的主要内容,如果未能解决你的问题,请参考以下文章

使用 python/pandas 从特定文件夹中读取几个嵌套的 .json 文件到 excel 中

读取json数据并嵌套读取值,保存到excel中。将句子进行jieba分词,保存到excel中

读取json数据并嵌套读取值,保存到excel中。将句子进行jieba分词,保存到excel中

如何在 C# 中使用嵌套的 json 对象

从嵌套的 Json 对象中读取值

在 C# 中,如何为具有多个嵌套数组的 JSON 对象建模?