从 C++ 文件中提取 JSON 数据

Posted

技术标签:

【中文标题】从 C++ 文件中提取 JSON 数据【英文标题】:Extract JSON data from file in C++ 【发布时间】:2014-05-25 22:37:24 【问题描述】:

这里,抱歉,如果这个问题不适合这个论坛。我对编程很陌生,并认为通过创建这个小项目可以更好地掌握字符串和文件。我要做的是从 JSON 文档中提取数据。最终我会将数据存储在一个数组中,然后再使用它。

基本上,我想知道是否有更好的方法来解决这个问题。代码看起来有点罗嗦,绝对不优雅。再次抱歉,如果这个问题不是一个好问题,但我认为没有比通过这样的社区更好的学习方式了。

#include <iostream>
#include <fstream>
#include <cstring>
#include <string>  //probably including more than necessary

using namespace std; //should be specifying items using scope resolution operator instead


int main(int argc, const char * argv[])


    ifstream sfile("JSONdatatest.txt");
    string line,temp;


    while(!sfile.eof())

        getline(sfile, line);
        temp.append(line);  //creates string from file text, use of temp seems extraneous

    
    sfile.close();


    cout << "Reading from the file.\n";
    size_t counter=0;
    size_t found=0;
    size_t datasize=0;

    while(found!=string::npos && found<1000*70) //problem here, program was creating infinite loop
                                                 //initial 'solution' was to constrain found var
                                                 //but fixed with if statement

    found = temp.find("name: ",counter);
        if(found!=string::npos) 

    found=found+7; //length of find variable "name: ", puts us to the point where data begins
    size_t ended=temp.find_first_of( "\"", found);

    size_t len=ended-found; //length of datum to extract


    string temp2(temp, found, len); //odd use of a second temp function, 
        cout << temp2 << endl;
        counter=ended+1;
        datasize++; //also problem with data size and counter, so many counters, can they 
                    //coordinate to have fewer?
    

    

    cout << datasize;


return 0

在我指出进行了无限循环的地方,我通过在 while 循环中添加 if 语句来修复。我的猜测是因为我将 7 添加到 'found' 中,它有可能跳过 npos 并且循环继续。添加 if 语句修复了它,但使代码看起来很笨重。必须有一个更优雅的解决方案。 提前致谢!

【问题讨论】:

您没有使用 JSON 解析器是否有原因? 可以使用第三方库的 JSON 解析器吗?例如,卡萨布兰卡项目中有一个。看看吧。 感谢 cmets。我环顾四周,并认为我最终会使用它增加的功能。 @WilliamAndrewMontgomery 我希望借此更好地理解字符串和文件,但可能不是最好的项目创意,哈哈。 【参考方案1】:

我建议您使用第三方来完成所有这些工作,这对于原始工具来说非常困难。我最近确实做了这种事情,所以我可以给你一些帮助。

我建议你看看boost::property_tree。 理论是这样的:一个 Json 文件就像一棵树,你有一个根,还有很多分支。 想法是将此 JSON 文件转换为 boost::property_tree::ptree,这样您就可以轻松使用对象 ptree 而不是文件。

首先,假设我们有这个 JSON 文件:


    "document": 
        "person": 
            "name": "JOHN",
            "age": 21
        ,
        "code": "AX-GFD123"
     

    "body" : "none"


那么在你的代码中,一定要包含:

 #include "boost/property_tree/ptree.hpp"
 #include "boost/property_tree/json_parser.hpp"

那么这里是最有趣的部分:

 boost::property_tree::ptree root;

您创建名为 root 的 ptree 对象。

boost::property_tree::read_json("/path_to_my_file/doc.json", root);

然后你告诉你要读取什么文件,以及将它存储在哪里(这里是根目录)。请注意,您应该在此使用try / catch,以防文件不存在。

那么你将只使用root 树,这真的很容易做到。您有很多功能(我邀请您查看 boost 文档页面)。

您想访问name字段。那就这样做吧:

std::string myname = root.get<std::string> ("document.person.name", "NOT FOUND");

get函数的第一个参数是获取你想要的属性的路径,第二个是如果路径不正确或不存在则默认返回。 &lt;std::string&gt; 是显示它必须返回的类型。

让我们以另一个例子结束。假设您要检查所有根节点,即位于顶层的每个节点。

  BOOST_FOREACH(const boost::property_tree::ptree::value_type& child, root.get_child(""))
   cout << child.first << endl; 

这有点复杂。我解释。你告诉 boost 用 root.get_child("") 来查看根的每个孩子,"" 用于根。然后,对于找到的每个子节点(如基本迭代器),您将使用 const boost::property_tree::ptree::value_type&amp; child

所以在foreach 中,您将使用child 访问您想要的任何内容。 child.first会给你当前使用的子节点的名字。在我的示例中,它将首先打印document,然后是body

我邀请您查看 Boost 文档。起初看起来可能很难,但之后真的很容易使用。

http://www.boost.org/doc/libs/1_41_0/doc/html/property_tree.html

【讨论】:

感谢您的精彩回复。这可能是我深入了解它的时候了。这是使用 JSON 的一个很好的起点。 我很高兴这有帮助。 Boost 一开始会觉得有点复杂,不过不用担心,阅读文档,尝试一些小功能,然后你就会习惯了。

以上是关于从 C++ 文件中提取 JSON 数据的主要内容,如果未能解决你的问题,请参考以下文章

在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据

从大型 json 文件 (~8GB) 中自动提取数据

NodeJS:从 JSON 中提取数据,修改对象并将其发送回同一个 JSON 文件

如何使用从 javascript/html 中的外部 php 文件中提取的 JSON 数据?

从文本文件中提取JSON数据到Excel

Gradle Spring Boot 应用程序无法从 Json 文件中提取数据