在机器学习中,可以通过python对数据进行获取与读写操作。通过以下代码可轻松实现:
import pandas as pd
df = pd.read_csv('./data/train.csv')
label = df['TARGET']
df = df.drop(['ID','TARGET'], axis=1)
import pandas不用说了,使用Python做数据处理需要装好pandas, numpy 和 scipy等几个包。
df = pd.read_csv('./data/train.csv')是读取数据集,label = df['TARGET']是将数据集中的标签即分类结果单独取出来放到label中。df = df.drop(['ID','TARGET'], axis=1)是删除不需要的特征,ID是数据集的顺序,本身并不带有信息量,TARGET之前我们已经放到label里面了,都可以去掉。使用pandas中的drop方法,axis=1就是把整列去掉











网友评论