美文网首页
pandas删除重复数据行

pandas删除重复数据行

作者: 数据小白周红艳 | 来源:发表于2020-08-22 11:21 被阅读0次

在处理pandas数据时,有时候需要删除重复数据,pandas为我们提供了drop_duplicates()函数。下面对其使用方法进行介绍:

# 首先导入常用的两个包
import pandas as pd
import numpy as np
# 建立一个dataframe数据
df = pd.DataFrame({'k1':['one']*3+['two']*4,'k2':[1,1,2,3,3,4,4]})
df['v1']=range(7)
df  
# 结果:
    k1  k2  v1
0   one 1   0
1   one 1   1
2   one 2   2
3   two 3   3
4   two 3   4
5   two 4   5
6   two 4   6
1.删除完全重复的行
df.drop_duplicates()
# 由于没有完全重复的行,因此返回结果跟原数据一致
# 结果:
    k1  k2  v1
0   one 1   0
1   one 1   1
2   one 2   2
3   two 3   3
4   two 3   4
5   two 4   5
6   two 4   6
2.按k1进行去重,对于重复项,保留第一次出现的值
df.drop_duplicates('k1',keep='first')
# 结果:
    k1  k2  v1
0   one 1   0
3   two 3   3
3.按k2和k1两列进行去重
df.drop_duplicates(['k2','k1'],keep='first')
# 结果:
    k1  k2  v1
0   one 1   0
2   one 2   2
3   two 3   3
5   two 4   5

keep:{‘first’, ‘last’, False}, 默认值 ‘first’

  • first:保留第一次出现的重复行,删除后面的重复行。
  • last:删除前面的重复项,保留最后一次出现的重复行。
  • False:删除所有重复项

相关文章

  • pandas常用操作

    pandas读取数据: pandas查看数据: pandas删除行、列: pandas排序: pandas合并列表...

  • pandas删除重复数据行

    在处理pandas数据时,有时候需要删除重复数据,pandas为我们提供了drop_duplicates()函数。...

  • 04-pandas-Ⅲ

    一.pandas数据处理 1.删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Se...

  • python--pandas删除

    删除是数据清洗中的高频操作,本文基于pandas,介绍其dataFrame的一些删除操作,包括了删除行,删除列,删...

  • pandas函数之drop_duplicates

    pandas版本号: 0.21.1 API链接 drop_duplicates是 用于删除重复的数据,第一个...

  • Python喊你吃饭了!

    去除重复数据 DataFrame中出现重复行有多种原因。下面就是一个例子: import pandas as pd...

  • python 一些使用小语法

    pandas只是提取指定时刻数据 pandas 将某列小于1的数设为1:方法1 方法2 方法3 找出标签重复行: ...

  • pandas删除空数据行及列dropna()

    import pandas as pd # 删除含有空数据的全部行 df4 = pd.read_csv('4.cs...

  • Python Pandas 依据属性值删除dataframe的行

    之前写过,依据索引/下标删除DataFrame的行或者列,参见pandas dataframe 删除行 drop ...

  • 07-查询、去重复下拉框

    1.去重复+下拉框 去重复:粘贴至新列→数据 删除重复项→修改首行名称使其简洁→创建公式首行命名→隐藏下拉框:数据...

网友评论

      本文标题:pandas删除重复数据行

      本文链接:https://www.haomeiwen.com/subject/dcpujktx.html