如何在 pandas 数据框中删除唯一行?

更新时间：2023-02-07 07:47:18

选择所有重复行的解决方案:

Solutions for select all duplicated rows:

您可以使用 duplicated 带有子集和参数keep=False的元素，用于选择所有重复项:

You can use duplicated with subset and parameter keep=False for select all duplicates:

df = df[df.duplicated(subset=['A','B'], keep=False)]
print (df)
     A  B  C
1  foo  1  A
2  foo  1  B

使用 transform :

df = df[df.groupby(['A', 'B'])['A'].transform('size') > 1]
print (df)
     A  B  C
1  foo  1  A
2  foo  1  B

对所有唯一行进行了一些修改的解决方案:

A bit modified solutions for select all unique rows:

#invert boolean mask by ~
df = df[~df.duplicated(subset=['A','B'], keep=False)]
print (df)
     A  B  C
0  foo  0  A
3  bar  1  A

df = df[df.groupby(['A', 'B'])['A'].transform('size') == 1]
print (df)
     A  B  C
0  foo  0  A
3  bar  1  A

上一篇 : ：删除记录sql server下一篇 : 如何删除没有唯一标识符的重复行

如何在 pandas 数据框中删除唯一行?

相关阅读

技术问答最新文章