如何填充列表中的值并将其转换为数据框?

Posted

技术标签:

【中文标题】如何填充列表中的值并将其转换为数据框?【英文标题】:How to fill the values in the list and convert it into the dataframe? 【发布时间】:2021-07-26 14:52:55 【问题描述】:

我想对我之前的问题做一些修改:

Iterating over conditions from columns and Dataframe to list conversion(pandas)

数据框是:

 Item   Quantity  Price     Photo1     Photo2    Photo3    Photo4

A        2         30      A1.jpg      A2.jpg 
B        4         10      B1.jpg      B2.jpg    B3.jpg    B4.jpg
C        5         15      C1.jpg

我试过了:

df1 = df.reindex(['Item','Quantity','Price','Photo1','Photo2','Photo3','Photo4','I','Q','P','PH',] axis=1)
df1['I'] = df1['I'].fillna['I']
df1['Q'] = df1['Q'].fillna['Q']
df1['P'] = df1['P'].fillna['P']
df1['PH'] = df1['PH'].fillna['PH']
vals = [['I','Item'],['Q','Quantity'],['P','Price']]

photo_df = df1.filter(like='Photo')
photo_df = photo_df.transform(lambda x: np.where(x.isnull(), x, x.name)) 
photo_df = photo_df.fillna('')

vals = [y for x in photo_df.to_numpy() 
         for y in vals[:3] + [['PH',z] for z in x[x!='']] ]

vals 返回:

[['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1'], ['PH', 'Photo2'], 
['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1'], ['PH', 'Photo2'], 
['PH', 'Photo3'], ['PH', 'Photo4'], ['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1']]

现在我要填写上一个数据框中的值:

我试过了:

L = [df1.loc[:, x].set_axis(range(len(x)), axis=1) for x in vals]

返回格式为:

[I,A,I,B,I,C,Q,2,Q,4,Q,5....................]

我希望 L 为:

[I,A,Q,2,P,30,PH,A1.jpg,PH,A2.jpg,I,B..............]

预期的数据框:

I       A
Q       2
P       4
PH      A1.jpg
PH      A2.jpg
I       B
Q       4
P       10 
PH      B1.jpg
PH      B2.jpg
PH      B3.jpg
PH      B4.jpg
I       C
Q       5
P       15
PH      C1.jpg

【问题讨论】:

对不起,我要开会,所以离线。那我在会议结束后尝试解决你的问题。 【参考方案1】:

使用DataFrame.stack 重塑Series.map 列名称并将不匹配的值替换为PH

d = 'Item':'I' , 'Quantity':'Q' ,'Price': 'P'
df = df.stack().reset_index(level=1).reset_index(drop=True)
df.columns = ['a','b']
df['a'] = df['a'].map(d).fillna('PH')
print (df)
     a       b
0    I       A
1    Q       2
2    P      30
3   PH  A1.jpg
4   PH  A2.jpg
5    I       B
6    Q       4
7    P      10
8   PH  B1.jpg
9   PH  B2.jpg
10  PH  B3.jpg
11  PH  B4.jpg
12   I       C
13   Q       5
14   P      15
15  PH  C1.jpg

编辑:值vals 是索引的添加值,然后用于选择:

vals = [(i, y) for i, x in enumerate(photo_df.to_numpy())
          for y in vals[:3] + [['PH',z] 
          for z in photo_df.columns[x!='']]]
print (vals)
[(0, ['I', 'Item']), (0, ['Q', 'Quantity']), (0, ['P', 'Price']), 
 (0, ['PH', 'Photo1']), (0, ['PH', 'Photo2']), (1, ['I', 'Item']),
 (1, ['Q', 'Quantity']), (1, ['P', 'Price']), (1, ['PH', 'Photo1']), 
 (1, ['PH', 'Photo2']), (1, ['PH', 'Photo3']), (1, ['PH', 'Photo4']),
 (2, ['I', 'Item']), (2, ['Q', 'Quantity']), (2, ['P', 'Price']), 
 (2, ['PH', 'Photo1'])]

L = [df1.loc[df1.index[[i]], x].set_axis(range(len(x)), axis=1) for i, x in vals]

df  = pd.concat(L)
print (df)
    0       1
0   I       A
0   Q       2
0   P      30
0  PH  A1.jpg
0  PH  A2.jpg
1   I       B
1   Q       4
1   P      10
1  PH  B1.jpg
1  PH  B2.jpg
1  PH  B3.jpg
1  PH  B4.jpg
2   I       C
2   Q       5
2   P      15
2  PH  C1.jpg
    

【讨论】:

@AtomStore - 那么不是按列名过滤列吗?喜欢['I', 'Item'] 返回所有列I, 'Item' ? 和我的差不多 ;) 但是用map会好一点 @AtomStore - 嗯,有什么特殊原因吗? 原因是字段很多,我无法映射某些字段,例如 'Item':'I' , 'Quantity':'Q' ,'Price': 'P' 。有些也是新角色。 @AtomStore - 了解,已编辑答案。【参考方案2】:

有点长,但是给你:

index = []
values = []
cnt = 0
for x in vals:
    if x[0] == 'I':
        cnt += 1
    index.append(x[0])
    values.append(df1.iloc[cnt-1][x[1]])
pd.DataFrame('index': index, 'values':values)

但是我不明白为什么你想用迂回的方式来做,而你可以用你的原始数据框df 做几行:

df2 = df.stack().reset_index()
df2.drop(columns=['level_0'],inplace=True)
df2['level_1'] = df2['level_1'].replace('Item':'I', 'Quantity':'Q', 'Price':'P', 'Photo1':'PH', 'Photo2':'PH', 'Photo3':'PH', 'Photo4':'PH')
df2

【讨论】:

您的解决方案是对的,但我需要转换从 vals 获得的值 @AtomStore 在这种情况下,您可以使用第一个代码块。

以上是关于如何填充列表中的值并将其转换为数据框?的主要内容,如果未能解决你的问题,请参考以下文章

从列表列表中提取元素并将其分配为熊猫数据框列中的值

如何使用 SQL 值动态填充列表框

Apache Spark:数据框中行值列表的百分比

从vba中的表填充列表框

如何使用 struct.unpack 并将其转换为 Objective-c 中的值

如何将 ARGB 值绑定到组合框项中的矩形填充属性?