美文网首页Python
pandas学习笔记之缺失值处理

pandas学习笔记之缺失值处理

作者: cugliming | 来源:发表于2021-03-21 13:04 被阅读0次

对于数据中的缺失值,有两种处理思路:

  • 删除
  • 插补

如何判断数据中是否存在缺失值?

  • pd.isnull(df) -> np.any(pd.isnull(df))
    返回True,则有缺失值
  • pd.notnull(df) -> np.all(pd.notnull(df))
    返回False,则有缺失值
  • 判断某一列是否有缺失值:
    • pd.isnull(df).any()
    • pd.notnull(df).all()
      判断列是否有缺失值
      判断列是否有缺失值
  • 将数据某一列中不包含空值的数据输出来:
    将 Ve 列中不包含空值的数据输出

删除含有缺失值的数据:

  • df.dropna(axis=, inplace=)
    • 默认按行删除,axis="rows"
    • 默认inplace=False,不替换、修改原始数据,生成新的对象

对缺失值进行插补:

  • df.fillna(value, inplace=)
    可选择填充平均值:
    data["Ve"].fillna(data["Ve"].mean())

缺失值为其他标记

例如,缺失值标记为“?”
?替换为np.nan,再做其他相似处理
df.replace(to_replace="?", value=np.nan)

相关文章

网友评论

    本文标题:pandas学习笔记之缺失值处理

    本文链接:https://www.haomeiwen.com/subject/kbyncltx.html