本节内容:图像分类概述、KNN、线性分类器
图像分类是计算机视觉的核心问题。
问题 :语义分割的鸿沟。图像仅仅是一个数字矩阵。
挑战:1. 视角多种多样。2. 亮度不同。 3. 形态各异。 4. 遮掩与局部图像。 5. 背景相似。6. 类内差异。
一个简单的图像分类器:
简单的分类器
目前最广泛的是数据驱动的方法。即选择一系列的数据集及标签,使用机器学习的方法去训练分类器,然后对新图像去评估。
数据驱动分类方法
最近邻法
最近邻法
即记住所有影像,然后在预测时选择最为相似的影像。
CIFAR10数据与最近邻分类
但是最近邻的问题为训练非常快(仅仅记录指针位置),预测则特别慢。
最近邻分类
同时有典型的两种距离测度。
L1距离。
L1距离
L2距离。
L1与L2
L1距离对方向敏感,而L2对各个方向都相似。
在分类当中存在超参数问题:此类参数无法通过学习得到,必须预先设定。如KNN里的K、距离测度等。
在获取超参数时,有若干问题。
首先不能选择在样本上效果最好的参数最佳参数,因为会过拟合;其次,不能将测试集上效果最好的最为结果,因为在新数据上的效果无法保证。
正确做法应当是将其分类训练集、验证集、测试集。超参数通过验证集得到,最终在测试集上测试一次作为最终精度。
数据集的划分
同时还有交叉验证的方式。
交叉验证
交叉验证精度
通过选取方差小、精度高时的参数,即为超参数,此种方法对数据量较小时较为有效,但是在大数据集时较为费时,并不常用。
然而,KNN并不常用!
线性分类(Linear Classification)
线性分类是网络的基础,像积木一样。
线性分类示意图
即将一幅图像矢量化,然后通过线性表达式f=Wx+b,其中W为权重矩阵,b为偏置,给出这10个类别的分数,取分数最大者为其类别。
线性分类示意图
线性分类器的解释。
线性分类器
将权重矩阵展开,即可得到每一类的较为模糊的影像,即为特征图像。
同时也可以认为,线性分类是在一个高维空间对影像进行划分。
线性分类器
线性分类器也存在一些问题。主要是类别边界非线性、类别混合等。
线性分类器的问题
未完待续














网友评论