机器学习之---身份认证

作者: 夏天707 | 来源:发表于2018-04-16 11:28 被阅读48次

最近在做机器学习身份认证的过程中,使用SVM(支持向量机)分类器效果很好,但是有一个无法避免的问题就是训练集必须有合法用户和非法用户的数据,才能训练分类器。但是实际应用中只能拿到合法用户的数据集,没有办法拿到非法用户的数据集。

为了解决这个问题我目前想到了两种方法:

方法1.在实际应用中首先在系统里面放几个提前收集好非法用户的数据,然后再实际应用中只需要合法用户的数据即可正常使用SVM分类器,但是这种方法有一定的缺陷,并且并未真正解决问题,因此我查阅相关文献,了解了一些其他解决方案。

方法2.使用单分类器,目前这方面的研究好像也不多,单分类器不像多分类器那样会搜索出很多种分类器,我在网上搜索到的单分类器只有三种,一般用于离群检验和异常点检测。                             三种分类器分别为:(1)OneClassSVM(2)EllipticEnvelope(3)IsolationForest                  同时再提取特征的时候一般是提取基于距离的特征,同普通的机器学习分类不同的是再特征提取之后多了一个步骤,需要计算特征向量之间的距离矩阵来描述特征之间的相似性,然后使用上述三种单分类器训练用户模型。

目前我没有进行提取基于距离的特征使用SVM二分类正确率再95%以上,但是使用OneClassSVM单分类器时正确率只有68%,后续还需要计算距离矩阵,验证基于距离的特征矩阵能否使用单分类器达到一个很高的正确率。

总结:

1.其实单分类器本质上是无监督学习,而二分类或者多分类SVM是带标签的监督性学习,因此从这方面来讲监督性学习的正确率应该是会比无监督学习分类器的正确率高一些。

2.机器学习中特征很重要,必须要结合领域知识提取代表性的特征,同时使用一些特征提取方法比如PCA等来提取更具代表性的特征来提高最终的分类正确率。

相关文章

  • 机器学习之---身份认证

    最近在做机器学习身份认证的过程中,使用SVM(支持向量机)分类器效果很好,但是有一个无法避免的问题就是训练集必须有...

  • [接口测试_B] 11 requests的身份认证方式

    requests提供多种身份认证方式,包括基本身份认证、netrc 认证、摘要式身份认证、OAuth 1 认证、O...

  • OAuth2 概念学习

    2020-6-1学习 认证(登录) 定义用户认证就是判断一个用户的身份是否合法的过程 身份认证方式用户名密码登录、...

  • Cookie、Session和Token的定义和区别

    在深入学习三者之前,先来了解一下身份认证和授权的概念 身份认证和授权 身份认证在很多领域得以应用,它用以验证当前用...

  • 相亲房开播基本功能操作方法

    1. 红娘认证技巧 认证入口:点击【我的】-“实名认证“-”红娘认证“ (1)完成身份认证 市场清晰的身份证正面照...

  • 身份认证

    身份认证 身份认证通用的准则 1.不是敏感账户作为外部业务的身份认证 2.外部账户不能跟内部类似AD账户通用 身份...

  • python requests库-身份验证

    基本身份认证 许多要求身份认证的web服务都接受HTTP Basic Auth。这是最简单的一种身份认证,并且Re...

  • Testin众测任务执行说明

    ①任务参与条件? 参与任务的大前提是通过身份认证 ②如何通过身份认证? 补全个人资料即可申请认证 必填项:身份证、...

  • SKIL/开始/身份认证

    身份认证 根据你使用SKIL的方式,始终需要身份认证。有几种方法可以通过SKIL获得身份认证,本文档将指导你完成每...

  • 身份认证

    身份认证 Route.js 路由页面 import { createSwitchNavigato...

网友评论

    本文标题:机器学习之---身份认证

    本文链接:https://www.haomeiwen.com/subject/lciskftx.html