机器学习和图像

       一直以为机器学习是一门很杂的学科,因为和其相关的交叉学科很多,比如统计学习、人工智能、模式识别、数据挖掘等等,在这些方向中有一个经常被忽视的那就是图像处理。图像处理本身又是一个比较大的方向,热门的图像特征检测、分类、检索、复原、去噪、增强、分割等等都属于其范畴。严格来说,图像处理拥有很久的发展史,由于图像本身拥有极强的特征结构信息,因此早期机器学习还未火热的时候图像处理就在很多行业得到了应用。最近的十年ML火热也带动了很多方向的发展,特别是在互联网、金融等行业,基于机器学习算法的推荐算法、点击预测、欺诈分类、用户流失等等方面都取得了重大成果,不过这些模型所处理的数据与图像有很大的区别,在深度学习之前未必有很多很高大上的算法能够优于传统的图像处理方法并且得到商用。在图像处理方向中,图像识别是近些年来非常火热的一个话题,特别是很多科技公司都发起了图像竞赛。图像识别并不是一个单一的方向,其应该包含前期的预处理中期的特征提取以及后期的分类,可以说图像的预处理和特征提取占据主要内容,我们通常所说的特征检测(比如人脸检测)就属于预处理的过程,不过特征检测本身又是一个很大的概念,而且关于这方面的研究和paper实在是太多太多了,因为特征检测在理论和实际运用中 都有很重要的地位。无论如何,在我看来,图像识别拥有一般数据模型无法比拟的特征优势,比如:

1.图像中像素点的局部区域信息非常丰富,如果直接用一般的机器学习模型会导致丢失这些局部关联信息,进而影响预测或者处理效果。以图像分类为例,基于局部描述特征(local descriptor)的特征提取方法取得了很多的成果,比如图像中的局部二值描述特征(LBP)、梯度特征(HOG)、旋转不变特征(SIFT)。

2.图像中的几何特征比较明显,因此在不同场景下进行不同的预测任务,通过合理地选取特征不仅能够获得很好的精度,而且可以满足较好的实时性要求。比如很经典的用于人脸检测特征Haar特征,通过使用简单的矩形特征模板匹配再通过Adaboost级联分类器,通过积分图来快速计算特征,在检测精度和实时性方面都取得了很不错的效果;Gabor特征对图像中的方向信息非常敏感,而掌纹图像恰恰包含大量的方向信息,因此使用Gabor滤波器和掌纹图像进行卷积获得方向响应再进行分类能获得不错的效果;再比如,车牌识别中,需要首先提取出车牌出的矩形区域,此时对图像边缘信息敏感的Sobel算子便派上了用场。

3.隐藏在图像识别背后的生物学机理。很多生物学家、脑学家或者神经科学家都试图挖掘人类大脑的视觉机理,图像识别从某种程度上看可以反映出人脸大脑如何去处理图像。比如,深度学习在图像分类中的一个重要应用卷积神经网络,其中便利用到了其中的一些启发:人脑对图像的认知源于对底层简单特征的多层综合,因此通过卷积之后的多层由简单到复杂的特征综合,能够很好地对图像做出分类决策。

    都说未来是人工智能发展的黄金期,如果人工智能能够得到发展和大规模应用,我相信图像识别一定是非常非常重要的一环。

发表评论

电子邮件地址不会被公开。 必填项已用*标注