美文网首页
Python数据分析系列01

Python数据分析系列01

作者: Tony_Pm | 来源:发表于2022-06-20 13:23 被阅读0次

序言

人生总是在不断的经历机遇与挑战,尽管现在的人很多都会选择躺平,但不得不承认的是,即便是一个躺平的人,同样会遇到一些生活中的挑战,而当你没有办法回避的时候,也就只能迎难而上了。
我们不该因为困难就轻易放弃,因为一切都会更加的值得。

实战

数据分析说白了就是对数据进行筛选、处理的一个过程,之后将清洗的数据进行图形可视化进行展示;比如这样的;先上一张完整版的图。


image.png

素材准备:
1、excel表格文件一份
2、安装第三方库 pip install pandas
3、安装第三方库 pip install matplotlib

表格素材
image.png

第一步: 读取excel 数据

import pandas

read_xl = pandas.read_excel('lagouzp.xls')

print(read_xl)

可以顺利的看到表格中有198 行 x 11列 的数据,展示了出来。接下来进行数据的提取,选择要处理并用于展示图像的某列,进行提取。
这里采用城市+薪资。


image.png image.png

第二步: 对数据 excel 进行处理

数据分析需要的数据种类是int类型,我们这里提取到的薪资数据明显是不符合要求的。让我们来处理一番。

# 1、需要被替换的值  2、 替换成什么样子
read_xl['薪资'] = read_xl['薪资'].str.replace('k','')
# 1530  薪资的区间  -  分割 - [15, 30]
read_xl['薪资'] = read_xl['薪资'].str.split('-')
#  最高薪资
read_xl['薪资'] = read_xl['薪资'].str[1]
print(read_xl['薪资'])
# 转换类型
read_xl['薪资'] = read_xl['薪资'].astype('int')

print(read_xl.dtypes)

经过我们的处理,数据已经符合我们的要求,接下来需要在对城市进行分组处理。


image.png image.png
#  平均值 - 5个北京 - 聚合  分组
city = read_xl.groupby(by='城市').mean()

name = city['薪资']

print(name)
image.png

第三步:筛选、清洗处理后的数据 - 数据分析- 绘制图像

from matplotlib import pyplot as plt

# 柱状图
plt.bar(x,y)

# 显示图像
plt.show()

结果展示

image.png
image.png
image.png image.png
image.png
image.png
在这个浮躁的时代;竟然还有人能坚持篇篇原创;
如果本文对你学习有所帮助-可以点赞👍+ 关注!将持续更新更多新的文章。
支持原创。感谢!

相关文章

网友评论

      本文标题:Python数据分析系列01

      本文链接:https://www.haomeiwen.com/subject/ctrhvrtx.html