值:要解压的值太多(预计 18 个)

Posted

技术标签:

【中文标题】值:要解压的值太多(预计 18 个)【英文标题】:Values: too many values to unpack (expected 18) 【发布时间】:2019-11-28 11:02:49 【问题描述】:

我试图用代码完成三件事,但我一直卡在第一步:

    清除 csv 文件中每一列的列表。专门针对indicatorgeocodegeoareatimeperiodvalue。在这里,我不断得到太多的值来解包错误。有 18 列。我尝试将tryexcept 包括在内,但是当有更多行时,我的列表被限制为384 行。您对解决方法有什么想法吗?

    为每一行创建列表

    筛选和选择最近一年的 2015 年列表

这是我一直在使用的数据:https://github.com/guillermocubells/sdg9b1_642

innovation_9b1 = open('Indicators_9_6.csv','r' , encoding = 'utf-8' , errors= 'ignore') 

innovation_9b1.readline()
indicator= []
geocode = []
geoarea = []
timeperiod= []
value = []  
for lines in innovation_9b1:
    _,_,i,_,_,g,a,tp,v,_,_,_,_,_,_,_,_,_,= lines.strip().split(',')
    indicator.append(i)
    geocode.append(g)
    geoarea.append(a)
    timeperiod.append(tp)
    print(lines)

【问题讨论】:

删除_,_,i,_,_,g,a,tp,v,_,_,_,_,_,_,_,_,_,中的最后一个逗号 看起来很适合 pandascsv.reader() Indicators_9_6.csv的编码好像是iso-8859-1,而不是utf-8 【参考方案1】:

考虑到你正在使用的变量,你最好像这样:

for lines in innovation_9b1:
    elements = lines.strip().split(',')
    indicator.append(elements[2])
    geocode.append(elements[5])
    geoarea.append(elements[6])
    timeperiod.append(elements[7])
    print(lines)

【讨论】:

【参考方案2】:

您也可以使用Python's csv module,而不是手动解析 CSV,它允许您将 CSV 解析为列表或字典。

例如,由于您的数据有标题,您可以使用csv.DictReader 将其解析为您可以通过标题寻址的字典。在此示例中,csv.Sniffer 用于确定您使用的 CSV 格式 - 我不确定它是什么。

import csv

indicator = []
geocode = []
geoarea = []
timeperiod = []
value = []  
with open('Indicators_9_6.csv', 'r', encoding='utf-8', errors='ignore') as innovation_9b1:
    dialect = csv.Sniffer().sniff(innovation_9b1.read())
    dialect.skipinitialspace = True
    innovation_9b1.seek(0)
    reader = csv.DictReader(innovation_9b1, dialect=dialect)
    for row in reader:
        indicator.append(row["Indicator"])
        geocode.append(row["GeoAreaCode"])
        geoarea.append(row["GeoAreaName"])
        timeperiod.append(row["TimePeriod"])
        print(row)

【讨论】:

【参考方案3】:

正如我在我的一个 cmets 中所说,pandas 是一个很好的例子:

import pandas as pd
from pathlib import Path

csv_file = Path('Indicators_9_6.csv')

delete_columns = [
    'Goal',
    'Target',
    'SeriesCode',
    'SeriesDescription',
    'Value',
    'Time_Detail',
    'UpperBound',
    'LowerBound',
    'BasePeriod',
    'Source',
    'FootNote',
    'Nature',
    'Units',
    '[Reporting Type]'
]

df = pd.DataFrame(
    pd.read_csv(
        csv_file,
        encoding='iso-8859-1',
        skipinitialspace=True
    )
)
df.drop(delete_columns, axis=1, inplace=True)

或者,您可以只阅读您想要的列:

import pandas as pd
from pathlib import Path

csv_file = Path('Indicators_9_6.csv')

columns = [
    'Indicator',
    'GeoAreaCode',
    'GeoAreaName',
    'TimePeriod'
]

df = pd.DataFrame(
    pd.read_csv(
        csv_file,
        encoding='iso-8859-1',
        skipinitialspace=True,
        usecols=columns
    )
)

之后,很容易通过名称来引用任何列:

>>> df.Indicator
0       6.4.2
1       6.4.2
2       6.4.2
3       6.4.2
4       6.4.2
        ...  
3529    9.b.1
3530    9.b.1
3531    9.b.1
3532    9.b.1
3533    9.b.1
Name: Indicator, Length: 3534, dtype: object
>>> 

这是一个概念证明:

Python 3.7.5 (default, Oct 17 2019, 12:16:48) 
[GCC 9.2.1 20190827 (Red Hat 9.2.1-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> from pathlib import Path
>>> 
>>> csv_file = Path('Indicators_9_6.csv')
>>> 
>>> columns = [
...     'Indicator',
...     'GeoAreaCode',
...     'GeoAreaName',
...     'TimePeriod'
... ]
>>> 
>>> df = pd.DataFrame(
...     pd.read_csv(
...         csv_file,
...         encoding='iso-8859-1',
...         skipinitialspace=True,
...         usecols=columns
...     )
... )
>>> df
     Indicator  GeoAreaCode  GeoAreaName  TimePeriod
0        6.4.2            4  Afghanistan        2000
1        6.4.2            4  Afghanistan        2005
2        6.4.2            4  Afghanistan        2010
3        6.4.2            4  Afghanistan        2015
4        6.4.2            8      Albania        2000
...        ...          ...          ...         ...
3529     9.b.1          894       Zambia        2012
3530     9.b.1          894       Zambia        2013
3531     9.b.1          894       Zambia        2014
3532     9.b.1          894       Zambia        2015
3533     9.b.1          894       Zambia        2016

[3534 rows x 4 columns]
>>> 

希望对你有帮助。

【讨论】:

谢谢!出于这个项目的目的,我们仅限于我们创建的内容,因此不能真正使用 pandas。但会记住进一步的任务

以上是关于值:要解压的值太多(预计 18 个)的主要内容,如果未能解决你的问题,请参考以下文章

将 Django 应用程序部署到 AWS 时出现“ValueError:要解压的值太多”

在 Python 中使用 NLTK 和 Pandas 解压的值太多

ValueError:在 Django 中解压的值太多(预期为 2)

ValueError:python2.7 的 zip 解压的值太多

Python2.7:要解包的值太多 - 列数未知

Django - 无法按外键 first_name 过滤