删除一个属性
现在我们要移除humidity这个属性(序号为3).
在预处理面板可以选择Filter(过滤器)
- 监督过滤器:在过滤时会使用Class的值,它们不如监督过滤器更为广泛应用。
在无监督过滤器中,我们可以找到attribute过滤器和instace过滤器。
我们现在要删除一个属性,因此使用一个属性过滤器。
属性过滤器也有很多,找到一个适合的:
配置过滤器
第一个参数输入remove的属性的序号。
第二个参数颠倒选择,就是删除选择序号以外的属性。
实际上有更简单的方式,在界面上,只需要选择属性,然后点击remove就行了。
但实际上,过滤器可以完成更复杂的事情。
过滤实例
接下来,我们尝试不删除某个属性,而是删除所有湿度值(humidity)为high的实例。属性对应的序号依然是3。
- 选择一个实例过滤器
-
这里用Remove with value
-
通过配置界面More
Filters instances accoording to hte value of an attribute.
刚好是我们要用到的功能。 - 配置好属性的序号,和属性值的序号(离散型)
-
点击Applay就进行了过滤
过滤前
过滤后
7.如果你需要修改数据集,可以点击Save进行修改。(这里不要修改),点击Undo就可以撤销操作。
总结:
过滤的意义
有时候通过过滤可以得到一个更好的分类。
举一个简单的例子:
这里依然用到glass.arff数据集
-
使用J48分类器
我们使用J48分类器,得到的准确率是66%:
-
删除一个属性
删除Fe:
-
重新运行J48
可以发现分类的准确率提高到67%。
事实上有的时候效果会更加明显
- 删除多个属性,再运行
删除除了RI和Mg以外的所有属性












网友评论