如何删除 pandas 数据框中具有重复列值的行?

更新时间：2023-08-28 16:10:58

将drop_duplicates与subset一起使用，并在列列表中检查重复项，并在keep='first'上保留重复项.

Using drop_duplicates with subset with list of columns to check for duplicates on and keep='first' to keep first of duplicates.

如果dataframe是:

df = pd.DataFrame({'Column1': ["'cat'", "'toy'", "'cat'"],
                   'Column2': ["'bat'", "'flower'", "'bat'"],
                   'Column3': ["'xyz'", "'abc'", "'lmn'"]})
print(df)

结果:

  Column1   Column2 Column3
0   'cat'     'bat'   'xyz'
1   'toy'  'flower'   'abc'
2   'cat'     'bat'   'lmn'

然后:

result_df = df.drop_duplicates(subset=['Column1', 'Column2'], keep='first')
print(result_df)

结果:

  Column1   Column2 Column3
0   'cat'     'bat'   'xyz'
1   'toy'  'flower'   'abc'

上一篇 : ：tkinter中一行代码中的多个按钮下一篇 : 如何设置从文本文件到字符串变量的每一行?

如何删除 pandas 数据框中具有重复列值的行?

相关阅读

推荐文章