码力全开 / 卷积神经网络特征提取

Created Wed, 07 Jan 2026 15:07:01 +0800 Modified Wed, 07 Jan 2026 15:28:19 +0800
469 Words 1 min

卷积是通过数学的方式从图像中提取其相关特征。假设我们有所示的图片:

0 0 0 0 0 0 0
0 1 0 0 0 1 0
0 0 1 0 1 0 0
0 0 0 1 0 0 0
0 0 1 0 1 0 0
0 1 0 0 0 1 0
0 0 0 0 0 0 0

其中黑色地方值为0,而白色地方值为1。实际上就是个数字X的图片。

而提取特征需要使用卷积核的工具,其尺寸一般是3x3或5x5的方块,比如下面用于提取右下线条的卷积核:

1 0 0
0 1 0
0 0 1

于是得到了特征图:

2 0 1 0 1
0 3 0 1 0
1 0 3 0 1
0 1 0 3 0
1 0 1 0 2

而卷积核中只有斜方向上的数字为1,因此卷积后对应位置的值特别大。而在特征图中,我们不妨找下哪里的值特别大。从而可以看到其满足右下线条的特征。

通过不同的卷积核我们可以对图像进行不同的处理,得到不同的特征图,从而显示特征分布在图像的什么位置。

之后我们通过池化技术简化特征图,将有特征的部分放大,比如使用最大池化,于是得到:

3 1 1
1 3 1
1 1 2

而池化后这个比较小的特征图依然保持原有特征图的重要信息,就是右下线条。

之后再经过激活过程,于是得到:

0.95 0.73 0.73
0.73 0.95 0.73
0.73 0.73 0.88

这张图依然代表图像的特性,数值越接近1越满足卷积核的特性。

参考视频:

https://www.bilibili.com/video/BV1dhHpeiET1

如果喜欢这篇文章或对您有帮助,可以:[☕] 请我喝杯咖啡 | [💓] 小额赞助