美文网首页
[CS231n]Lecture 2 Image Classifi

[CS231n]Lecture 2 Image Classifi

作者: csuhan | 来源:发表于2018-12-27 02:00 被阅读0次

本节内容:图像分类概述、KNN、线性分类器

图像分类是计算机视觉的核心问题。

问题 :语义分割的鸿沟。图像仅仅是一个数字矩阵。
挑战:1. 视角多种多样。2. 亮度不同。 3. 形态各异。 4. 遮掩与局部图像。 5. 背景相似。6. 类内差异。
一个简单的图像分类器:


简单的分类器

目前最广泛的是数据驱动的方法。即选择一系列的数据集及标签,使用机器学习的方法去训练分类器,然后对新图像去评估。


数据驱动分类方法

最近邻法

最近邻法

即记住所有影像,然后在预测时选择最为相似的影像。


CIFAR10数据与最近邻分类

但是最近邻的问题为训练非常快(仅仅记录指针位置),预测则特别慢。


最近邻分类

同时有典型的两种距离测度。
L1距离。


L1距离

L2距离。


L1与L2
L1距离对方向敏感,而L2对各个方向都相似。

在分类当中存在超参数问题:此类参数无法通过学习得到,必须预先设定。如KNN里的K、距离测度等。

在获取超参数时,有若干问题。
首先不能选择在样本上效果最好的参数最佳参数,因为会过拟合;其次,不能将测试集上效果最好的最为结果,因为在新数据上的效果无法保证。
正确做法应当是将其分类训练集、验证集、测试集。超参数通过验证集得到,最终在测试集上测试一次作为最终精度。


数据集的划分

同时还有交叉验证的方式。


交叉验证
交叉验证精度
通过选取方差小、精度高时的参数,即为超参数,此种方法对数据量较小时较为有效,但是在大数据集时较为费时,并不常用。

然而,KNN并不常用!

线性分类(Linear Classification)

线性分类是网络的基础,像积木一样。


线性分类示意图

即将一幅图像矢量化,然后通过线性表达式f=Wx+b,其中W为权重矩阵,b为偏置,给出这10个类别的分数,取分数最大者为其类别。


线性分类示意图
线性分类器的解释。
线性分类器

将权重矩阵展开,即可得到每一类的较为模糊的影像,即为特征图像。
同时也可以认为,线性分类是在一个高维空间对影像进行划分。


线性分类器

线性分类器也存在一些问题。主要是类别边界非线性、类别混合等。


线性分类器的问题 未完待续

相关文章

网友评论

      本文标题:[CS231n]Lecture 2 Image Classifi

      本文链接:https://www.haomeiwen.com/subject/ryellqtx.html