我有一个 dataframe
像这样的
index col1 col2 col3 col4
0 11/20 11/26 abc 35
1 11/21 11/24 xxx 30
2 11/22 11/27 abc 20
在这里, col3
具有同样的价值(重复基础上的价值)。
我 sum()
col4
从行基于 col3
值。
因此,在这种情况下我做的
df = df.groupby(['col3'])[['col4']].sum()
但用这种方法得到我
index col3 col4
0 abc 55
1 xxx 30
我希望能够保留第一个发生重复的价值的 col1
(11/20)和最后一次出现 col2
(11/27),因此最终产品会看起来像
index col1 col2 col3 col4
0 11/20 11/27 abc 55
1 11/21 11/24 xxx 30