如何填充列表中的值并将其转换为数据框?
Posted
技术标签:
【中文标题】如何填充列表中的值并将其转换为数据框?【英文标题】:How to fill the values in the list and convert it into the dataframe? 【发布时间】:2021-07-26 14:52:55 【问题描述】:我想对我之前的问题做一些修改:
Iterating over conditions from columns and Dataframe to list conversion(pandas)
数据框是:
Item Quantity Price Photo1 Photo2 Photo3 Photo4
A 2 30 A1.jpg A2.jpg
B 4 10 B1.jpg B2.jpg B3.jpg B4.jpg
C 5 15 C1.jpg
我试过了:
df1 = df.reindex(['Item','Quantity','Price','Photo1','Photo2','Photo3','Photo4','I','Q','P','PH',] axis=1)
df1['I'] = df1['I'].fillna['I']
df1['Q'] = df1['Q'].fillna['Q']
df1['P'] = df1['P'].fillna['P']
df1['PH'] = df1['PH'].fillna['PH']
vals = [['I','Item'],['Q','Quantity'],['P','Price']]
photo_df = df1.filter(like='Photo')
photo_df = photo_df.transform(lambda x: np.where(x.isnull(), x, x.name))
photo_df = photo_df.fillna('')
vals = [y for x in photo_df.to_numpy()
for y in vals[:3] + [['PH',z] for z in x[x!='']] ]
vals 返回:
[['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1'], ['PH', 'Photo2'],
['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1'], ['PH', 'Photo2'],
['PH', 'Photo3'], ['PH', 'Photo4'], ['I', 'Item'], ['Q', 'Quantity'], ['P', 'Price'], ['PH', 'Photo1']]
现在我要填写上一个数据框中的值:
我试过了:
L = [df1.loc[:, x].set_axis(range(len(x)), axis=1) for x in vals]
返回格式为:
[I,A,I,B,I,C,Q,2,Q,4,Q,5....................]
我希望 L 为:
[I,A,Q,2,P,30,PH,A1.jpg,PH,A2.jpg,I,B..............]
预期的数据框:
I A
Q 2
P 4
PH A1.jpg
PH A2.jpg
I B
Q 4
P 10
PH B1.jpg
PH B2.jpg
PH B3.jpg
PH B4.jpg
I C
Q 5
P 15
PH C1.jpg
【问题讨论】:
对不起,我要开会,所以离线。那我在会议结束后尝试解决你的问题。 【参考方案1】:使用DataFrame.stack
重塑Series.map
列名称并将不匹配的值替换为PH
:
d = 'Item':'I' , 'Quantity':'Q' ,'Price': 'P'
df = df.stack().reset_index(level=1).reset_index(drop=True)
df.columns = ['a','b']
df['a'] = df['a'].map(d).fillna('PH')
print (df)
a b
0 I A
1 Q 2
2 P 30
3 PH A1.jpg
4 PH A2.jpg
5 I B
6 Q 4
7 P 10
8 PH B1.jpg
9 PH B2.jpg
10 PH B3.jpg
11 PH B4.jpg
12 I C
13 Q 5
14 P 15
15 PH C1.jpg
编辑:值vals
是索引的添加值,然后用于选择:
vals = [(i, y) for i, x in enumerate(photo_df.to_numpy())
for y in vals[:3] + [['PH',z]
for z in photo_df.columns[x!='']]]
print (vals)
[(0, ['I', 'Item']), (0, ['Q', 'Quantity']), (0, ['P', 'Price']),
(0, ['PH', 'Photo1']), (0, ['PH', 'Photo2']), (1, ['I', 'Item']),
(1, ['Q', 'Quantity']), (1, ['P', 'Price']), (1, ['PH', 'Photo1']),
(1, ['PH', 'Photo2']), (1, ['PH', 'Photo3']), (1, ['PH', 'Photo4']),
(2, ['I', 'Item']), (2, ['Q', 'Quantity']), (2, ['P', 'Price']),
(2, ['PH', 'Photo1'])]
L = [df1.loc[df1.index[[i]], x].set_axis(range(len(x)), axis=1) for i, x in vals]
df = pd.concat(L)
print (df)
0 1
0 I A
0 Q 2
0 P 30
0 PH A1.jpg
0 PH A2.jpg
1 I B
1 Q 4
1 P 10
1 PH B1.jpg
1 PH B2.jpg
1 PH B3.jpg
1 PH B4.jpg
2 I C
2 Q 5
2 P 15
2 PH C1.jpg
【讨论】:
@AtomStore - 那么不是按列名过滤列吗?喜欢['I', 'Item']
返回所有列I, 'Item'
?
和我的差不多 ;) 但是用map
会好一点
@AtomStore - 嗯,有什么特殊原因吗?
原因是字段很多,我无法映射某些字段,例如 'Item':'I' , 'Quantity':'Q' ,'Price': 'P' 。有些也是新角色。
@AtomStore - 了解,已编辑答案。【参考方案2】:
有点长,但是给你:
index = []
values = []
cnt = 0
for x in vals:
if x[0] == 'I':
cnt += 1
index.append(x[0])
values.append(df1.iloc[cnt-1][x[1]])
pd.DataFrame('index': index, 'values':values)
但是我不明白为什么你想用迂回的方式来做,而你可以用你的原始数据框df
做几行:
df2 = df.stack().reset_index()
df2.drop(columns=['level_0'],inplace=True)
df2['level_1'] = df2['level_1'].replace('Item':'I', 'Quantity':'Q', 'Price':'P', 'Photo1':'PH', 'Photo2':'PH', 'Photo3':'PH', 'Photo4':'PH')
df2
【讨论】:
您的解决方案是对的,但我需要转换从 vals 获得的值 @AtomStore 在这种情况下,您可以使用第一个代码块。以上是关于如何填充列表中的值并将其转换为数据框?的主要内容,如果未能解决你的问题,请参考以下文章