2学习时间3.7小时
仰卧起坐150
第二遍练习《七周七》项目练习。计划今晚敲完。前面一个半小时也非常专心。学到11点20左右的时候就想睡觉,写了下总结。
今日学习:练习项目+复习numpy、pandas.发现numpy包中正则表达式还没有学习
结合自己分析项目方法《抱团学习》
1、 本次复习的过程中有自己的思维,逻辑比较清楚。
2、 发现自己每一次代码只运行了一个函数,但是秦路老师经常运行3个以上的函数。也经常使用groupby,而我之前在分析的时候几乎没有使用groupby函数
比如昨天我想分析期望工作为A的同学他们学习时间的数据图,结果自己是用loc筛选出A数据保存为新表之后在进行数据的分析。秦路老师直接groupby就可以分析
3、 部分练习的时候新增了标题和饼状图。有些代码自己可以操作不用看秦路老师写的代码
4、 在分析的时候,先描述数据在结合业务分析
思维、多个函数运行groupby、熟悉代码
重点
数据透视表、时间函数、新知识(回/复购率)
1、 数据透视表还比较陌生,简单的匿名函数的使用(熟练简单的修改数据)

2、 回购率、复购率
复购率定义是在某时间窗口内消费两次以上用户在总有消费用户中占比
回购率是某一个时间窗口内消费的用户,在下一个时间时间窗口人就消费的占比。回购率比较难,因为它设计了横向跨时间窗口的对比

3、 多个函数的练习使用。如:df.groupby('user_id').month.max().value_counts().plot.barh()。逻辑顺序

4、 时间的转化

小结:。明天继续模仿秦路老师的项目练习,准备好下一个练习项目的数据资料(一个数据分析+一个游戏?)
以后写了总结,第二天上班路上传上去……修改格式。今天把秦路老师的项目练习完
网友评论