如何使用for循环从列表中提取数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用for循环从列表中提取数据相关的知识,希望对你有一定的参考价值。

我有一个包含数字数据的列表。数字用点“。”分隔。和空格“”除非它们是负数,在这种情况下,空格“”由负号“ - ”代替。

我一直无法获取所有信息,这些信息应该适合2982x16矩阵,因为数字不是以相同的方式分开的。

列表的一部分是这样的:

1. 1.3884e-17. 0.0000e+00. 1.1913e+00. 1.3996e+00.-7.7122e-01.-1.8788e-01.-5.3170e-16. 1.0076e-31. 0.0000e+00. 3.9673e+05.-1.9531e+05.-3.6224e+04.-7.2504e-11. 1.3740e-26. 0.0000e+00

2. 1.3573e-17. 7.3889e-02. 1.3726e+00. 1.6331e+00. 1.2526e+00. 1.5132e+00.-1.3979e-16.-5.3936e-32.-2.9361e-16. 5.9535e+05. 4.9158e+05. 5.6265e+05.-1.9062e-11.-7.3549e-27.-4.0038e-11

到目前为止,我只能用这样的东西提取前两列:

mat[i,1]=ast.literal_eval(line[3+k:13+k].replace(" ",""))

第一部分旨在将文本转换为浮点数,最后一部分旨在消除文本中的空格。在这种情况下,数字'1.3884e-17'和'1.3573e-17'将被放置在我的矩阵的第二列中,但这对以下内容不起作用,当然更改列表的索引。

任何帮助,将不胜感激。

答案
s = '1. 1.3884e-17. 0.0000e+00. 1.1913e+00. 1.3996e+00.-7.7122e-01.-1.8788e-01.-5.3170e-16. 1.0076e-31. 0.0000e+00. 3.9673e+05.-1.9531e+05.-3.6224e+04.-7.2504e-11. 1.3740e-26. 0.0000e+00'

数字由.分隔,后跟空格或短划线。使用正则表达式匹配该分隔符并在其上拆分字符串。该模式需要使用先行断言来防止消耗负号。

>>> import re
>>> pattern = r'[.](?=[ -])'
>>> re.split(pattern, s)
['1', ' 1.3884e-17', ' 0.0000e+00', ' 1.1913e+00', ' 1.3996e+00', '-7.7122e-01', '-1.8788e-01', '-5.3170e-16', ' 1.0076e-31', ' 0.0000e+00', ' 3.9673e+05', '-1.9531e+05', '-3.6224e+04', '-7.2504e-11', ' 1.3740e-26', ' 0.0000e+00']

使每个数字都浮动

>>> [float(n) for n in re.split(pattern, s)]
[1.0, 1.3884e-17, 0.0, 1.1913, 1.3996, -0.77122, -0.18788, -5.317e-16, 1.0076e-31, 0.0, 396730.0, -195310.0, -36224.0, -7.2504e-11, 1.374e-26, 0.0]
>>> 

如果不需要每行的第一个数字,请使用切片将其排除:

>>> numbers = re.split(pattern, s)
>>> [float(n) for n in numbers[1:]]
[1.3884e-17, 0.0, 1.1913, 1.3996, -0.77122, -0.18788, -5.317e-16, 1.0076e-31, 0.0, 396730.0, -195310.0, -36224.0, -7.2504e-11, 1.374e-26, 0.0]
>>>
另一答案

我会用re.findall()来匹配每个数字。

这个表达式应该有效:-?d+.d+e[+-]d+

  • -? - 可选的减号
  • d+ - 数字序列,即有效数字的整个部分
  • . - 字面时期
  • d+ - 有效数的小数部分
  • e[+-] - 字面意思“e”后跟指数的符号
  • d+ - 指数

#!/usr/bin/env python3

import re
import pprint

string_data = '''1. 1.3884e-17. 0.0000e+00. 1.1913e+00. 1.3996e+00.-7.7122e-01.-1.8788e-01.-5.3170e-16. 1.0076e-31. 0.0000e+00. 3.9673e+05.-1.9531e+05.-3.6224e+04.-7.2504e-11. 1.3740e-26. 0.0000e+00
2. 1.3573e-17. 7.3889e-02. 1.3726e+00. 1.6331e+00. 1.2526e+00. 1.5132e+00.-1.3979e-16.-5.3936e-32.-2.9361e-16. 5.9535e+05. 4.9158e+05. 5.6265e+05.-1.9062e-11.-7.3549e-27.-4.0038e-11
'''
data = [
    [
        float(number) for number in re.findall(r'-?d+.d+e[+-]d+', line)
    ]
    for line in string_data.splitlines()
]

pprint.pprint(data)

以上是关于如何使用for循环从列表中提取数据的主要内容,如果未能解决你的问题,请参考以下文章

使用从循环内的代码片段中提取的函数避免代码冗余/计算开销

使用for循环从数组迭代到列表

从 for 循环打印时出现问题

如何使用引导程序和 for 循环在 django 中创建电影片段?

迭代 4 个 pandas 数据框列并将它们存储到 4 个列表中,其中一个 for 循环而不是 4 个 for 循环

如何在我的 for 循环之外执行代码(需要等到循环完成从 Firebase 数据库中检索数据)?