机器学习项目的步骤
1导入数据文件,通常是以csv文件的形式出现
2清理数据,删除错误与不必要的数据,让数据可靠
3把数据拆分成训练库与测试库
4创建模型。有许多算法可以选择,各有优点,根据所要处理的问题,选择一个就好
5训练我们的模型,把数据提供给模型进行训练
6作出预测
7评估预测,衡量它们的准确性
常用库和工具
常用库
Numpy 多维数组
Pandas 数据分析库,提供一个称为数据帧的概念。数据帧是二维的
MatPlotLib 二维绘图库
Scikit-Learn 机器学习,提供通用的库,如决策树,神经网络等
机器学习项目的工具
Jupyter
下载网址:anaconda
安装jupyter
下载数据集
网址kaggle
因无法注册kaggle,暂停这个内容的学习,后续加上学习笔记
网友评论