将字典键设为行,将字典值设为列,一个值作为列名,一个作为列值

Posted

技术标签:

【中文标题】将字典键设为行,将字典值设为列,一个值作为列名,一个作为列值【英文标题】:Make dictionary keys into rows and dict values as columns with one value as column name and one as column value 【发布时间】:2021-10-07 21:02:45 【问题描述】:

我有以下数据:

print(tables['T10101'].keys())

dict_keys(['Y033RL', 'A007RL', 'A253RL', 'A646RL', 'A829RL', 'A008RL', 'A191RP', 'DGDSRL', 'A822RL', 'A824RL', 'A006RL', 'A825RL', 'A656RL', 'A823RL', 'Y001RL', 'DNDGRL', 'DDURRL', 'A021RL', 'A009RL', 'A020RL', 'DSERRL', 'A011RL', 'DPCERL', 'A255RL', 'A191RL'])

每个键都有以下值,一个元组列表: 日期相同,但值发生变化。

[('-20.7', '1930'), ('-33.3', '1931'), ('-41.4', '1932'), ('2.5', '1933'), ('38.3', '1934'), ('36.3', '1935'), ('37.2', '1936'), ('16.2', '1937'), ('-30.4', '1938'), ('15.4', '1939'), ('29.6', '1940'), ('17.2', '1941'), ('-42.6', '1942'), ('-10.2', '1943'), ('33.7', '1944'), ('43.2', '1945'), ('24.7', '1946'), ('36.0', '1947'), ('-8.3', '1947Q2'), 

我想创建以下数据框:

       1930 | 1931 | 1932 | 1933 | 1934 |
Y033RL|-20.7| -33.3| -41.4| 2.5  | 38.3 |
A007RL| data| data | data | data | data |

最好的方法是什么?我想出了这种加入创建数据框的迂回方式,但由于我有很多数据,它的效率非常低。我想先将所有内容都放在字典中,然后将其转换为一个数据框。

def dframeCreator(dataname):
    dframeList = list(tables[dataname].keys())
    df = tables[dataname][dframeList[0]]
    for x in range(len(dframeList[1:])):
        df = df.join(tables[dataname][dframeList[x+1]])
    return df

【问题讨论】:

【参考方案1】:

如果tables 是你的字典,你可以这样做:

df = pd.DataFrame(
    ["idx": k, **dict([(b, a) for a, b in v]) for k, v in tables.items()],
).set_index("idx")
df.index.name = None
print(df)

打印:

         1930   1931   1932 1933  1934  1935  1936  1937   1938  1939  1940  1941   1942   1943  1944  1945  1946  1947 1947Q2
T10101  -20.7  -33.3  -41.4  2.5  38.3  36.3  37.2  16.2  -30.4  15.4  29.6  17.2  -42.6  -10.2  33.7  43.2  24.7  36.0   -8.3
A007RL    xxx    xxx    xxx  xxx   xxx   xxx   xxx   xxx    xxx   xxx   xxx   xxx    xxx    xxx   xxx   xxx   xxx   xxx    xxx

【讨论】:

这几乎就是我要找的东西,但不完全是,其他用户找到了它。但感谢您抽出宝贵时间回复。【参考方案2】:

我们可以使用dict 理解以适合创建数据框的标准格式对给定字典进行规范化

d  = tables['T10101']
df = pd.DataFrame(k: dict(map(reversed, v)) for k, v in d.items()).T

print(df)

         1930   1931   1932 1933 ... 1945  1946  1947 1947Q2
Y033RL  -20.7  -33.3  -41.4  2.5 ... 43.2  24.7  36.0   -8.3

【讨论】:

感谢 Shubham 及时、简单且准确的回复 - 我将您标记为已回答,但我意识到我遗漏了代码中相当有问题的部分 - 我的字典嵌套如下:tables['T10101'] = 'Y033RL' , 'info': 'extra info on data here', 'data' : [('-20.7', '1930'), etc.] 。所以我很难改变理解以适应这种特殊性。 你能提供一个与键T10101对应的精确字典输出吗? ` 'Y033RL': 'info': 'Description': 'Equipment', 'METRIC_NAME': 'Fisher Quantity Index', 'UNIT_MULT': '0', 'CL UNIT' : '百分比变化,年率', '数据': [('-20.7', '1930'), ('-33.3', '1931'), ('-41.4', '1932') ] , 'A007RL': 'info': 'Description': 'Fixed Investment', 'METRIC_NAME': 'Fisher Quantity Index', 'UNIT_MULT': '0', 'CL UNIT': '百分比变化,年利率' , '数据': [('-22.3', '1930'), ('-28.9', '1931'), ('-38.4', '1932'), ('-9.7', '1933'), ('26.5', '1934')] ` @Bigboss01 你可以使用df = pd.DataFrame(k: dict(map(reversed, v['data'])) for k, v in d.items()).T

以上是关于将字典键设为行,将字典值设为列,一个值作为列名,一个作为列值的主要内容,如果未能解决你的问题,请参考以下文章

HashMap浅入理解

如何将第一个下拉值设为无

如何将多个值添加到python中的字典键? [关闭]

是否可以将 CSS 选择器中的重要属性值设为不重要的属性值?

将字典转换为数据框,键作为列名,键值作为数据框的列值

怎样用SQL语句将表的主键设为自动增长 每次加1?