[Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）

您所在的位置：网站首页 › 算法论文5000字 › [Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）

[Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）

2024-01-30 03:39| 来源: 网络整理| 查看: 265

该系列文章是讲解Python OpenCV图像处理知识，前期主要讲解图像入门、OpenCV基础用法，中期讲解图像处理的各种算法，包括图像锐化算子、图像增强技术、图像分割等，后期结合深度学习研究图像识别、图像分类应用。希望文章对您有所帮助，如果有不足之处，还请海涵~

前面一篇文章介绍了图像增强知识，从而改善图像质量，增强图像识别效果，核心内容分为直方图均衡化、局部直方图均衡化和自动色彩均衡三部分。这篇文章将详细讲解图像分类知识，包括常见的图像分类算法，并介绍Python环境下的贝叶斯图像分类算法、基于KNN算法的图像分类和基于神经网络算法的图像分类等案例。万字长文整理，希望对您有所帮助。同时，该部分知识均为作者查阅资料撰写总结，并且开设成了收费专栏，为小宝赚点奶粉钱，感谢您的抬爱。如果有问题随时私聊我，只望您能从这个系列中学到知识，一起加油喔~

代码下载地址（如果喜欢记得star，一定喔）：

https://github.com/eastmountyxz/ImageProcessing-Python

文章目录一.图像分类概述二.常见的分类算法1.朴素贝叶斯分类算法2.KNN分类算法3.SVM分类算法4.随机森林分类算法5.神经网络分类算法三.基于朴素贝叶斯算法的图像分类四.基于KNN算法的图像分类五.基于神经网络算法的图像分类六.总结

前文参考：

[Python图像处理] 一.图像处理基础知识及OpenCV入门函数[Python图像处理] 二.OpenCV+Numpy库读取与修改像素[Python图像处理] 三.获取图像属性、兴趣ROI区域及通道处理[Python图像处理] 四.图像平滑之均值滤波、方框滤波、高斯滤波及中值滤波[Python图像处理] 五.图像融合、加法运算及图像类型转换[Python图像处理] 六.图像缩放、图像旋转、图像翻转与图像平移[Python图像处理] 七.图像阈值化处理及算法对比[Python图像处理] 八.图像腐蚀与图像膨胀[Python图像处理] 九.形态学之图像开运算、闭运算、梯度运算[Python图像处理] 十.形态学之图像顶帽运算和黑帽运算[Python图像处理] 十一.灰度直方图概念及OpenCV绘制直方图[Python图像处理] 十二.图像几何变换之图像仿射变换、图像透视变换和图像校正[Python图像处理] 十三.基于灰度三维图的图像顶帽运算和黑帽运算[Python图像处理] 十四.基于OpenCV和像素处理的图像灰度化处理[Python图像处理] 十五.图像的灰度线性变换[Python图像处理] 十六.图像的灰度非线性变换之对数变换、伽马变换[Python图像处理] 十七.图像锐化与边缘检测之Roberts算子、Prewitt算子、Sobel算子和Laplacian算子[Python图像处理] 十八.图像锐化与边缘检测之Scharr算子、Canny算子和LOG算子[Python图像处理] 十九.图像分割之基于K-Means聚类的区域分割[Python图像处理] 二十.图像量化处理和采样处理及局部马赛克特效[Python图像处理] 二十一.图像金字塔之图像向下取样和向上取样[Python图像处理] 二十二.Python图像傅里叶变换原理及实现[Python图像处理] 二十三.傅里叶变换之高通滤波和低通滤波[Python图像处理] 二十四.图像特效处理之毛玻璃、浮雕和油漆特效[Python图像处理] 二十五.图像特效处理之素描、怀旧、光照、流年以及滤镜特效[Python图像处理] 二十六.图像分类原理及基于KNN、朴素贝叶斯算法的图像分类案例[Python图像处理] 二十七.OpenGL入门及绘制基本图形（一）[Python图像处理] 二十八.OpenCV快速实现人脸检测及视频中的人脸[Python图像处理] 二十九.MoviePy视频编辑库实现抖音短视频剪切合并操作[Python图像处理] 三十.图像量化及采样处理万字详细总结（推荐）[Python图像处理] 三十一.图像点运算处理两万字详细总结（灰度化处理、阈值化处理）[Python图像处理] 三十二.傅里叶变换（图像去噪）与霍夫变换（特征识别）万字详细总结[Python图像处理] 三十三.图像各种特效处理及原理万字详解（毛玻璃、浮雕、素描、怀旧、流年、滤镜等）[Python图像处理] 三十四.数字图像处理基础与几何图形绘制万字详解（推荐）[Python图像处理] 三十五.OpenCV图像处理入门、算数逻辑运算与图像融合（推荐）[Python图像处理] 三十六.OpenCV图像几何变换万字详解（平移缩放旋转、镜像仿射透视）[Python图像处理] 三十七.OpenCV和Matplotlib绘制直方图万字详解（掩膜直方图、H-S直方图、黑夜白天判断）[Python图像处理] 三十八.OpenCV图像增强万字详解（直方图均衡化、局部直方图均衡化、自动色彩均衡化）[Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）一.图像分类概述

图像分类（Image Classification）是对图像内容进行分类的问题，它利用计算机对图像进行定量分析，把图像或图像中的区域划分为若干个类别，以代替人的视觉判断。

图像分类的传统方法是特征描述及检测，这类传统方法可能对于一些简单的图像分类是有效的，但由于实际情况非常复杂，传统的分类方法不堪重负。现在，广泛使用机器学习和深度学习的方法来处理图像分类问题，其主要任务是给定一堆输入图片，将其指派到一个已知的混合类别中的某个标签。

在图1中，图像分类模型将获取单个图像，并将为4个标签{cat，dog，hat，mug}分配对应的概率{0.6, 0.3, 0.05, 0.05}，其中0.6表示图像标签为猫的概率，其余类比。

在这里插入图片描述

如图1所示，该图像被表示为一个三维数组。在这个例子中，猫的图像宽度为248像素，高度为400像素，并具有红绿蓝三个颜色通道（通常称为RGB）。因此，图像由248×400×3个数字组成或总共297600个数字，每个数字是一个从0（黑色）到255（白色）的整数。图像分类的任务是将这接近30万个数字变成一个单一的标签，如“猫（cat）”。

那么，如何编写一个图像分类的算法呢？又怎么从众多图像中识别出猫呢？这里所采取的方法和教育小孩看图识物类似，给出很多图像数据，让模型不断去学习每个类的特征。在训练之前，首先需要对训练集的图像进行分类标注，如图2所示，包括cat、dog、mug和hat四类。在实际工程中，可能有成千上万类别的物体，每个类别都会有上百万张图像。

在这里插入图片描述

图像分类是输入一堆图像的像素值数组，然后给它分配一个分类标签，通过训练学习来建立算法模型，接着使用该模型进行图像分类预测，具体流程如下：

输入：输入包含N个图像的集合，每个图像的标签是K种分类标签中的一种，这个集合称为训练集；学习：第二步任务是使用训练集来学习每个类的特征，构建训练分类器或者分类模型；评价：通过分类器来预测新输入图像的分类标签，并以此来评价分类器的质量。通过分类器预测的标签和图像真正的分类标签对比，从而评价分类算法的好坏。如果分类器预测的分类标签和图像真正的分类标签一致，表示预测正确，否则预测错误。二.常见的分类算法

常见的分类算法包括朴素贝叶斯分类器、决策树、K最近邻分类算法、支持向量机、神经网络和基于规则的分类算法等，同时还有用于组合单一类方法的集成学习算法，如Bagging和Boosting等。

1.朴素贝叶斯分类算法

朴素贝叶斯分类（Naive Bayes Classifier）发源于古典数学理论，利用Bayes定理来预测一个未知类别的样本属于各个类别的可能性，选择其中可能性最大的一个类别作为该样本的最终类别。在朴素贝叶斯分类模型中，它将为每一个类别的特征向量建立服从正态分布的函数，给定训练数据，算法将会估计每一个类别的向量均值和方差矩阵，然后根据这些进行预测。

在这里插入图片描述

朴素贝叶斯分类模型的正式定义如下：

在这里插入图片描述

该算法的特点为：如果没有很多数据，该模型会比很多复杂的模型获得更好的性能，因为复杂的模型用了太多假设，以致产生欠拟合。

2.KNN分类算法

K最近邻分类（K-Nearest Neighbor Classifier）算法是一种基于实例的分类方法，是数据挖掘分类技术中最简单常用的方法之一。该算法的核心思想如下：一个样本x与样本集中的k个最相邻的样本中的大多数属于某一个类别yLabel，那么该样本x也属于类别yLabel，并具有这个类别样本的特性。简而言之，一个样本与数据集中的k个最相邻样本中的大多数的类别相同。

在这里插入图片描述

由其思想可以看出，KNN是通过测量不同特征值之间的距离进行分类，而且在决策样本类别时，只参考样本周围k个“邻居”样本的所属类别。因此比较适合处理样本集存在较多重叠的场景，主要用于预测分析、文本分类、降维等处理。

该算法在建立训练集时，就要确定训练数据及其对应的类别标签；然后把待分类的测试数据与训练集数据依次进行特征比较，从训练集中挑选出最相近的k个数据，这k个数据中投票最多的分类，即为新样本的类别。KNN分类算法的流程描述为如图3所示。

在这里插入图片描述

该算法的特点为：简单有效，但因为需要存储所有的训练集，占用很大内存，速度相对较慢，使用该方法前通常训练集需要进行降维处理。

3.SVM分类算法

支持向量机（Support Vector Machine）是数学家Vapnik等人根据统计学习理论提出的一种新的学习方法，其基本模型定义为特征空间上间隔最大的线性分类器，其学习策略是间隔最大化，最终转换为一个凸二次规划问题的求解。

SVM分类算法基于核函数把特征向量映射到高维空间，建立一个线性判别函数，解最优在某种意义上是两类中距离分割面最近的特征向量和分割面的距离最大化。离分割面最近的特征向量被称为“支持向量”，即其它向量不影响分割面。图像分类中的SVM如图4所示，将图像划分为不同类别。

在这里插入图片描述

下面的例子可以让读者对SVM快速建立一个认知。给定训练样本，支持向量机建立一个超平面作为决策曲面，使得正例和反例的隔离边界最大化。决策曲面的构建过程如下所示：

第一步，在图5中，想象红球和蓝球为球台上的桌球，首先需要找到一条曲线将蓝球和红球分开，于是得到一条黑色的曲线；

在这里插入图片描述

第二步，为了使黑色曲线离任意的蓝球和红球距离最大化，我们需要找到一条最优的曲线，如图6所示；

在这里插入图片描述

第三步，假设这些球不是在球桌上，而是抛在空中，但仍然需要将红球和蓝球分开，这时就需要一个曲面，而且该曲面仍然满足所有任意红球和蓝球的间距最大化，如图7所示。离这个曲面最近的红色球和蓝色球就被称为“支持向量（Support Vector）”。

在这里插入图片描述

该算法的特点为：当数据集比较小的时候，支持向量机的效果非常好。同时，SVM分类算法较好地解决了非线性、高维数、局部极小点等问题，维数大于样本数时仍然有效。

4.随机森林分类算法

随机森林（Random Forest）是用随机的方式建立一个森林，在森林里有很多决策树的组成，并且每一棵决策树之间是没有关联的。当有一个新样本出现的时候，通过森林中的每一棵决策树分别进行判断，看看这个样本属于哪一类，然后用投票的方式，决定哪一类被选择的多，并作为最终的分类结果。

在这里插入图片描述

随机森林中的每一个决策树“种植”和“生长”主要包括以下四个步骤：

假设训练集中的样本个数为N，通过有重置的重复多次抽样获取这N个样本，抽样结果将作为生成决策树的训练集；如果有M个输入变量，每个节点都将随机选择m(m

【本文地址】

[Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）

[Python图像处理] 三十九.Python图像分类万字详解（贝叶斯图像分类、KNN图像分类、DNN图像分类）

今日新闻

推荐新闻