解析双精度的普通python列表
Posted
技术标签:
【中文标题】解析双精度的普通python列表【英文标题】:parse plain python list of double 【发布时间】:2011-07-04 09:28:17 【问题描述】:解析这样的一行最好的方法是什么(元素的数量不固定):
[ 0.0125, 2.9518e+02, 1.2833e+00, -3.5302e-04, 1.2095e+01, 1.0858e-01, 1.2112e-04, 1.1276e+03 ] # comments
在 c++ 中获得double
的std::vector
?我已经这样做了:
vector<double> read_line(string line)
vector<double> coefficients_line;
// erase all before [ and all after ]
size_t found1 = line.find("[");
if (found1 == string::npos) cerr << "line not valid: " << line;
line.erase(line.begin(), line.begin() + found1 + 1);
size_t found2 = line.find("]");
if (found2 == string::npos) cerr << "line not valid: " << line;
line.erase(line.begin() + found2, line.end());
vector<string> coefficients_string;
boost::split(coefficients_string, line, boost::is_any_of(","));
for (vector<string>::const_iterator ic=coefficients_string.begin();
ic!=coefficients_string.end(); ++ic)
cout << "c string \"" << *ic << "\"" << endl;
string s = *ic;
boost::trim(s);
double c = boost::lexical_cast<double>(s);
cout << "c double: " << c << endl;
coefficients.push_back(c);
return coefficients;
欢迎使用非增强但简单的解决方案
【问题讨论】:
【参考方案1】:鉴于格式,我认为使用 IO Streams 很简单。
#include <iostream>
#include <sstream>
#include <vector>
int main()
std::istringstream line("[ 1.23, 1.24e+3, 3, 1.44e-2 ]");
char c;
while ((line >> c) && c != '[');
if (!line) return 1;
std::vector<double> v;
double d;
while ((line >> d)) v.push_back(d); line >> c; if (c != ',') break;
for (std::vector<double>::const_iterator i = v.begin(), e = v.end();
i != e; ++i)
std::cout << *i << "\n";
return 0;
打印:
1.23
1240
3
0.0144
(在ideone行动)
它不是一个成熟的解析器,并且会接受不正确的输入(值得注意的是,它不会在最后检查]
。但我会说它已经相当不错了。
【讨论】:
【参考方案2】:我看到您已经在使用boost
。为此,您绝对应该尝试boost.spirit.qi
。
#include <vector>
#include <string>
#include <iostream>
#include <boost/spirit/include/qi.hpp>
namespace qi = ::boost::spirit::qi;
template <typename Iterator>
bool parse_numbers(Iterator & first, Iterator last, std::vector<double> & v)
using qi::double_;
using qi::phrase_parse;
using qi::_1;
using boost::spirit::ascii::space;
return phrase_parse(first, last, ('[' >> double_ % ',' >> ']'), space, v);
int main()
std::string s = "[ 0.0125, 2.9518e+02, 1.2833e+00, -3.5302e-04, 1.2095e+01, 1.0858e-01, 1.2112e-04, 1.1276e+03 ] # comments";
std::vector<double> v;
std::string::iterator sb = s.begin();
parse_numbers(sb, s.end(), v);
std::cout << "Parsed numbers:" << std::endl;
for (int i = 0; i < v.size(); ++i) std::cout << v[i] << std::endl;
std::cout << "Rest of line:" << std::endl;
std::cout << std::string(sb, s.end()) << std::endl;
我从spirit
的文档中获取了parse_numbers()
函数并对其进行了一些调整。它在解析失败时返回 false(即不是一个格式良好的列表),但当该行在列表后面有任何文本时返回 true:第一个迭代器 (@987654327 @ in main()
) 将指向号码列表的结束位置。
在此处查看完整文档:http://www.boost.org/doc/libs/1_46_1/libs/spirit/doc/html/spirit/qi.html
【讨论】:
谢谢,您的解决方案非常干净。问题是在我们的集群error: boost/spirit/include/qi.hpp: No such file or directory
上,我们有严格的策略来添加软件。我们安装了spirit
库,但没有安装qi
@wiso:啊,那可能是旧的spirit
,在被拆分为qi
、lex
和karma
之前(我不熟悉,抱歉)。但无论如何,spirit
只是标题!您可以将其标题复制到您的源代码树:)【参考方案3】:
如果你的编译器支持 C++0x,那么你可以使用 AX 来解析这个字符串:
std::vector<double> read_line(std::string line)
std::vector<double> v;
auto spaces = *axe::r_any(" \t\n\r");
double d;
auto double_rule = spaces & axe::r_double(d)
>> axe::e_ref([](...) v.push_back(d); );
auto array_rule = '[' & double_rule % ',' & ']';
array_rule(line.begin(), line.end());
return v;
附:我还没有测试过,所以可能会出现表面错误。
【讨论】:
以上是关于解析双精度的普通python列表的主要内容,如果未能解决你的问题,请参考以下文章