美文网首页
数据预处理:一些pandas操作

数据预处理:一些pandas操作

作者: glassyw | 来源:发表于2017-11-18 17:42 被阅读46次

官方文档:十分钟上手pandas
这里主要mark一些常用的操作

0.导入库

import pandas as pd
import numpy as np

1.读数据

data=pd.read_csv('path',header=None,encoding='utf-8',sep = '\t',index_col=0) #读取csv文件
data = pd.read_table('path',header=None,encoding='utf-8',sep = '\t',index_col=0)#读取txt文件

其中后面可以带一些指定的参数,指定编码、分隔符等等

2.导出数据

data.to_csv('path',encoding='utf-8',sep = '\t')  #同样可以指定格式

3.统计

data_sum=data.groupby(by=[0,1]).sum() #统计由(0,1)这两列分组下的总和
data_max=data.groupby(by=[0,1]).max() #统计由(0,1)这两列分组下的最大值
data_max=data.groupby(by=[0,1]).min() #统计由(0,1)这两列分组下的最小值
data_max=data.groupby(by=[0,1]).mean() #统计由(0,1)这两列分组下的均值
data_std=data.groupby(by=[0]).std() #统计标准差

4.修改表

new_data_time.reset_index(name='times')  #重命名列名

5.拼接数据

需求:统计了某列数据的结果,想要拼接到结果表中

data_sum=data_sum.assign(times=data_time[2]) #指定data_sum的列为data_time的数据,相当于把data_time名字为2的列拼到data_sum后

6.设置精度

需求:统计后发现float、double数据小数点位数太多

rret_1=rret_0.round({name1:1,name2:1}) #意思是:将这两列精确到小数点后1位

相关文章

  • Pandas常用方法

    一、Pandas数据结构 二、读取数据 三、数据预处理 四、数据选择 五、数值操作 六、数据运算 七、时间序列 八...

  • 数据预处理:一些pandas操作

    官方文档:十分钟上手pandas这里主要mark一些常用的操作 0.导入库 1.读数据 其中后面可以带一些指定的参...

  • 实现机器学习的初步流程

    1.读取数据(pandas) 读取csv、xls文件等 2.数据预处理、分析(pandas) 预处理工作:缺少列头...

  • 5.6 应用实例

    本节引入两个实际案例,介绍Pandas工具对数据集进行预处理的操作方法。 5.6.1 分析titanic数据 首先...

  • Python Pandas 使用[ ]进行数据操作

    Python Pandas 使用[ ]进行数据操作 本文将介绍Pandas中“[ ]”的一些相关操作,如进行数据选...

  • python--Pandas中DataFrame基本函数(略全)

    在python中,众所周知,数据预处理最好用的包就是pandas了,以下是pandas里的dataframe数据结...

  • 数据预处理(Pandas&Numpy部分)

    整理了一些利用pandas和numpy对文件进行预处理的常用方法,数据为加州房价预测数据,仅供参考(to be c...

  • pandas 数据预处理

    pandas 数据加载 pandas 数据查看 pandas 非编码数据编码 去重 空值 空值 --- >> 填充...

  • 数据预处理(pandas and sklearn)

    使用python的pandas和sklearn库对数据进行预处理 数据 参考https://blog.csdn.n...

  • Python pandas

    在Python中,pandas是基于NumPy数组构建的,使数据预处理、清洗、分析工作变得更快更简单。pandas...

网友评论

      本文标题:数据预处理:一些pandas操作

      本文链接:https://www.haomeiwen.com/subject/awzevxtx.html