卷积是通过数学的方式从图像中提取其相关特征。假设我们有所示的图片:
0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0
其中黑色地方值为0,而白色地方值为1。实际上就是个数字X的图片。
而提取特征需要使用卷积核的工具,其尺寸一般是3x3或5x5的方块,比如下面用于提取右下线条的卷积核:
1 0 0 0 1 0 0 0 1
于是得到了特征图:
2 0 1 0 1 0 3 0 1 0 1 0 3 0 1 0 1 0 3 0 1 0 1 0 2
而卷积核中只有斜方向上的数字为1,因此卷积后对应位置的值特别大。而在特征图中,我们不妨找下哪里的值特别大。从而可以看到其满足右下线条的特征。
通过不同的卷积核我们可以对图像进行不同的处理,得到不同的特征图,从而显示特征分布在图像的什么位置。
之后我们通过池化技术简化特征图,将有特征的部分放大,比如使用最大池化,于是得到:
3 1 1 1 3 1 1 1 2
而池化后这个比较小的特征图依然保持原有特征图的重要信息,就是右下线条。
之后再经过激活过程,于是得到:
0.95 0.73 0.73 0.73 0.95 0.73 0.73 0.73 0.88
这张图依然代表图像的特性,数值越接近1越满足卷积核的特性。
参考视频:
如果喜欢这篇文章或对您有帮助,可以:[☕] 请我喝杯咖啡 | [💓] 小额赞助

