yaml-cpp 甚至为 const 节点修改底层容器?

Posted

技术标签:

【中文标题】yaml-cpp 甚至为 const 节点修改底层容器?【英文标题】:yaml-cpp modifies underlying container even for const nodes? 【发布时间】:2017-04-24 20:34:23 【问题描述】:

我有一个 test.yml 文件,

test1:
  test1_file: 'test.yml'

我想在 C++ 代码中加载这个 yaml 文件并从中检索数据。

对于我的用例,还有其他文件必须合并到数据中。我找到了here 的答案(我认为......)。所以,yaml-cpp 看起来很漂亮。坦率地说,它的界面看起来有点奇怪,但我真的不想重新发明***。 const YAML::Node & cnode(const YAML::Node & node) return node;相当一种代码味道。

好的,所以我有一些代码尝试导航到给定节点...

#include <iostream>
#include <string>
#include <vector>
#include <algorithm>
#include <stdexcept>
#include <yaml-cpp/yaml.h>

using node_name = std::string;
using node_path = std::vector<node_name>;

const YAML::Node & constify(const YAML::Node & node) 
    return node;


YAML::Node navigate(const YAML::Node & root_node, const node_path & path) 

    // no path elements?
    if ( path.empty() ) 
        return root_node;
    

    // any elements are empty?
    if ( std::any_of(path.begin(), path.end(), [](const auto & part)return part.empty();) ) 
        throw std::invalid_argument"navigate to node_path with empty elements";
    

    // set up initial root node info
    YAML::Node current = root_node;
    const node_name * parent_node_name = nullptr;

    auto throw_path_not_found = [&](const node_name & element_name) 
        node_path not_found_node_path;
        if ( parent_node_name ) 
            // parent_node_name points to the last processed parent
            // if we pass it as-is as an end-iterator, then it will
            // not be included in the container. So increment it.
            //
            // Then, we're at the current node name (which wasn't found)
            // so increment it once more to have the full path.
            parent_node_name += 2;

            not_found_node_path = &*path.begin(), parent_node_name;
         else 
            not_found_node_path = path.begin(), path.begin() + 1;
        

        // throw yaml_path_not_foundnot_found_node_path, current, element_name;
        std::string err_msg"path not found: ";
        std::for_each(not_found_node_path.begin(), not_found_node_path.end(), [&](const node_name & n)err_msg += n + ".";);
        throw std::runtime_errorstd::move(err_msg);
    ;

    // query node to see if we can continue
    auto query_node_type = [&](const node_name & element_name)
        switch (current.Type()) 
        case YAML::NodeType::Scalar:
            // Reached end of node chain before reaching end of desired node path?
            if ( &element_name != &path.back() ) 
                throw_path_not_found(element_name);
            
            return;
        case YAML::NodeType::Sequence: // aka array
            // this can be fine if the next node element is an integer to access the array
            // otherwise we'll get an Undefined node on the next iteration.
            return;
        case YAML::NodeType::Map:
            // this can be fine if the next node element is a key into the map
            // otherwise we'll get an Undefined node on the next iteration.
            return;
        case YAML::NodeType::Null:
            // the node path exists but contains no value ???
            // more like a std::set, I think?
            // if this causes issues, then fix it.
            return;
        case YAML::NodeType::Undefined:
            throw_path_not_found(element_name);

        // no-default:
        // allow compiler to warn on changes to enum
        

        throw std::logic_errorstd::string"unexpected node type " + std::to_string(current.Type()) + " returned from yaml-cpp";
    ;

    // loop through path elements querying to see if we've prematurely stopped
    for ( const auto & element : path ) 
        current = current[element];
        query_node_type(element);
        parent_node_name = &element;
    

    return current;


node_path split_node_path(const std::string & path) 
    node_path result;

    result.emplace_back();

    // prod code just uses boost::algorithm::string::split
    for ( char c : path ) 
        if ( '.' == c ) 
            result.emplace_back();
            continue;
        
        result.back().push_back(c);
    

    return result;

我的想法是我应该能够提供一个节点路径,例如"test1.test1_file",它应该为此检索节点。但是,我注意到第一次这样做效果很好,但第二次因为找不到节点而最终抛出。等等,什么?

是的,好的:

void dump(const YAML::Node & node) 
    std::cout << "...DUMP...\n" << YAML::Dump(node) << std::endl;


int main(int argc, char **argv) 
    if ( 3 != argc ) 
        std::cerr << "Usage: ./a.out test.yml test1.test1.file\n";
        return EXIT_FAILURE;
    

    try 
        YAML::Node root_node = YAML::LoadFile(argv[1]);

        dump(root_node);

        navigate(root_node, split_node_path(argv[2]));

        dump(root_node);

        navigate(root_node, split_node_path(argv[2]));

     catch (const std::exception & e) 
        std::cerr << "exception: " << e.what() << '\n';
        return EXIT_FAILURE;
    

    return EXIT_SUCCESS;

构建并执行它g++ test.cpp -lyaml-cpp -std=c++17g++ (Ubuntu 6.2.0-3ubuntu11~16.04) 6.2.0 20160901 成功。然而,调用它会产生意想不到的输出:

$ ./a.out test.yml test1.test1_file ...DUMP... test1: test1_file: test.yml ...DUMP... test1_file: test.yml exception: path not found: test1.

我完全希望转储是相同的(并且不会抛出异常):navigate() 接受 const YAML::Node &amp;。这告诉我它不应该修改根节点。那么具体修改在哪里呢?更重要的是,我做错了什么?

我怀疑它与需要 cnode() 函数来 const-ify YAML::Nodes 的其他答案有关。但是当我尝试做同样的事情时,它似乎没有帮助(正如在这个最小示例中未使用的 constify() 函数所证明的那样)。

【问题讨论】:

【参考方案1】:

YAML::Node 是引用类型,而不是值类型。这意味着const YAML::Node&amp; 有点误导;这就像说const unique_ptr&lt;T&gt;&amp;。您可以修改底层价值T

此外,还有一些 YAML API 在这样的循环中有点令人困惑。

YAML::Node current = ...;
for ( const auto & element : path ) 
    // this actually is a mutating call; it identifies the root node
    // with the sub-node
    current = current[element];

【讨论】:

那么如何在不使用递归或破坏树的情况下进行遍历呢? 你必须使用递归。 .. 或添加一个间接层,例如,带有空删除器的 unique_ptr。

以上是关于yaml-cpp 甚至为 const 节点修改底层容器?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用yaml-cpp修改map节点(删除key的值)

yaml-cpp 总是创建一个大小为 0 的标量节点

在 yaml-cpp 中操作节点

yaml-cpp:创建一个未定义的节点

在 yaml-cpp 中按名称删除节点

你如何确定你在 yaml-cpp 中处理啥样的节点?