美文网首页
Weka在数据挖掘中的运用 05 Using a filter

Weka在数据挖掘中的运用 05 Using a filter

作者: jenye_ | 来源:发表于2020-10-02 11:29 被阅读0次

删除一个属性


现在我们要移除humidity这个属性(序号为3).
在预处理面板可以选择Filter(过滤器)


  • 监督过滤器:在过滤时会使用Class的值,它们不如监督过滤器更为广泛应用。

在无监督过滤器中,我们可以找到attribute过滤器和instace过滤器。

我们现在要删除一个属性,因此使用一个属性过滤器。

属性过滤器也有很多,找到一个适合的:




配置过滤器



第一个参数输入remove的属性的序号。

第二个参数颠倒选择,就是删除选择序号以外的属性。

实际上有更简单的方式,在界面上,只需要选择属性,然后点击remove就行了。




但实际上,过滤器可以完成更复杂的事情。


过滤实例

接下来,我们尝试不删除某个属性,而是删除所有湿度值(humidity)为high的实例。属性对应的序号依然是3。

  1. 选择一个实例过滤器
  2. 这里用Remove with value


  3. 通过配置界面More



    Filters instances accoording to hte value of an attribute.
    刚好是我们要用到的功能。

  4. 配置好属性的序号,和属性值的序号(离散型)
  5. 点击Applay就进行了过滤


    过滤前
    过滤后

    7.如果你需要修改数据集,可以点击Save进行修改。(这里不要修改),点击Undo就可以撤销操作。
    总结:



过滤的意义

有时候通过过滤可以得到一个更好的分类。
举一个简单的例子:
这里依然用到glass.arff数据集

  • 使用J48分类器
    我们使用J48分类器,得到的准确率是66%:


  • 删除一个属性
    删除Fe:


  • 重新运行J48



    可以发现分类的准确率提高到67%。

事实上有的时候效果会更加明显

  • 删除多个属性,再运行
    删除除了RI和Mg以外的所有属性

相关文章

网友评论

      本文标题:Weka在数据挖掘中的运用 05 Using a filter

      本文链接:https://www.haomeiwen.com/subject/ferfuktx.html