如何仅保存重复项?
Posted
技术标签:
【中文标题】如何仅保存重复项?【英文标题】:How to save duplicates only? 【发布时间】:2021-03-21 01:45:36 【问题描述】:我编写了代码以从我的 xlsx 文件中的 col 中删除重复项。
import pandas as pd
from openpyxl.workbook import Workbook
def delete_duplicates(nazov_suboru, cielovy_subor,riadok):
data = pd.read_excel(nazov_suboru)
print("chvilelenku pockaj")
data.drop_duplicates(subset=[riadok], keep=False, inplace=True)
data.to_excel(cielovy_subor, index=False)
print("done")
它保存唯一的数据。但我需要相反的。只保存重复的。想不通。请有任何想法/
【问题讨论】:
【参考方案1】:data = data[data.duplicated(subset=[riadok], keep=False)]
将保留重复的行。
见pandas.DataFrame.duplicated
【讨论】:
不会是keep="last"
只保存重复的对象吗?
last :将重复项标记为 True,但最后一次出现除外。 False :将所有重复项标记为 True。 @TheLazyScripter Op 希望保留重复的
啊,我明白了。感谢您的澄清!以上是关于如何仅保存重复项?的主要内容,如果未能解决你的问题,请参考以下文章