从文本文件中查找和提取数据

Posted

技术标签:

【中文标题】从文本文件中查找和提取数据【英文标题】:Find and extract data from a text file 【发布时间】:2012-02-22 07:36:15 【问题描述】:

我正在尝试搜索文本文件并在标题后提取数据。但是,我遇到了一些我不知道如何解决的迭代器问题。

这是一个示例文本文件:

Relay States
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0

理想情况下,我想调用 LoadData<bool> something.LoadData("Relay States"); 并让它返回一个带有 0,0,0,0,0,0,0,0,... 的 std::vector。

template<typename T> std::vector<T> CProfile::LoadData(const std::string& name)

    std::ifstream ifs(FILE_NAME);
    std::vector<T> data;
    std::istreambuf_iterator<char> iit = std::istreambuf_iterator<char>(ifs);

    std::search(iit, ifs.eof(), name.begin(), name.end());
    std::advance(iit, name.size() + 1);

    T buffer = 0;
    for(ifs.seekg(iit); ifs.peek() != '\n' && !ifs.eof(); data.push_back(ifs))
    
        ifs >> buffer;
        data.push_back(buffer);
    

    return data;

据我了解,我的代码的主要问题是:

std::search 是一个模棱两可的调用,我该如何解决这个问题? ifs.seekg(iit) 不合法,我该如何让 iit 成为有效参数?

谢谢。

【问题讨论】:

标题和数据总是在不同的行上吗?单独行上的数据是否像您显示的示例中那样?数据量是否始终相同,或者您如何跟踪数据量? 如果数据来自二维数组,那么就和上面一样。要确定要下载多少,我必须在标题名称和“\n\n”之间阅读。数据后面总是有两个\n。 【参考方案1】:

我认为你的参数到 std::search 是问题

std::search(iit, ifs.eof(), name.begin(), name.end());

应该是

std::search(iit, std::istreambuf_iterator<char>(), name.begin(), name.end());

至于线:for 循环中的ifs.seekg(iit) 不好,因为 seekg 需要一些 streampos 类型的偏移量而不是迭代器。所以应该是ifs.seekg(0)

【讨论】:

感谢您的回复。你知道我如何将偏移量设置为 iit 指向的字符吗? @user968243 iit 是 istream 缓冲区迭代器,它在内部从 istream 的缓冲区获取字节(因此,当您将 iit 推进 name.size() + 1 时,它会从 @987654331 读取那么多字节@'s buffer) ,它实际上没有任何位置。从看到你的代码,我可以说iitname.size() + 1 先进(所以它目前在name.size() + 1 的字节),所以你可以做ifs.seekg(name.size() + 1)【参考方案2】:

这样的事情怎么样:

template<typename T> std::vector<T> CProfile::RealLoadData(std::istream &is)

    std::string line;
    std::vector<T> data;

    while (std::getline(is, line))
    
        if (line.empty())
            break;  // Empty line, end of data

        std::istringstream iss(line);

        T temp;
        while (iss >> temp)
            data.push_back(temp);
    

    return data;


template<typename T> std::vector<T> CProfile::LoadData(const std::string& name)

    std::string line;
    std::ifstream ifs(FILE_NAME);

    while (std::getline(ifs, line))
    
        if (line == name)
        
            // Found the section, now get the actual data
            return RealLoadData<T>(ifs);
        
    

    // Section not found, return an empty vector
    return std::vector<T>();

【讨论】:

以上是关于从文本文件中查找和提取数据的主要内容,如果未能解决你的问题,请参考以下文章

Linux Bash - 修改从标准输出中提取的文本

从文本文件中提取不均匀的数据

如何在文本文件中查找行并导出行号

从文本文件中提取数据

如何从 PDF 文件中提取文本和文本坐标?

从pdf文件中提取特定数据