Table of contents
从“卷积”、到“图像卷积操作”、再到“卷积神经网络”,“卷积”意义的3次改变
卷积
-
$\int_{-\infin}^{+\infin} f(\tau) g(x-\tau) d\tau$
-
一个人一边进食一边消化,进食函数 f 显示了各时刻的进食量:
消化函数 g 表示肚子里剩余食物的比例随时间的变化,它与吃多少无关:
比如要求一个人在下午2点,肚子里还剩多少食物,就是之前吃的每一顿饭经过了“独立”的消化后剩余的部分再求和:
一般情况,求t时刻的胃中还剩多少食物:x时刻吃的食物f(x),经过了(t-x)时间,还剩下的比例是$g(t-x)$,乘以总量就是x时刻吃的食物到t时刻还剩多少$f(x)\cdot g(t-x)$,对t之前每一时刻吃的东西到了t时刻还剩多少,加起来:$\int_0^t f(x) g(t-x) dx$
其中两函数的自变量相加后,x就被消掉了,这是卷积的一个标志。
x 与 (t-x) 在图像上的对应:
-
一个系统,输入(f)不稳定,输出(g)稳定,就可以用卷积来求这个系统的存量
-
另一种理解:之前发生的事件对当前事件的影响,每件事的影响力随时间变化是g,所以导致 t 时刻事件的发生是之前各时刻事件的影响在t时刻的和。
如果影响是随距离变化的函数,那么在某位置的事件就是之前各位置在此位置产生的影响之和。
始皇既没,余威震于殊俗。 – 贾谊《过秦论》
图像的卷积操作
-
周围像素点对当前像素点的影响
-
3x3卷积核规定周围一圈像素对当前像素点的影响,5x5就是用了周围2圈。平滑卷积操作就是把当前像素值替换为与周围像素的平均值。
-
卷积核与图片的数学运算:$f(x,y)\star g(m,n) = \sum f(x,y) \cdot g(m-x, n-y)$。(x与m-x相加只剩m,y与n-y相加只剩n,两个维度上都是卷积)
如果只考虑点(x,y) 周围相邻1个像素对它的影响,并且每个相邻像素对当前像素的影响由卷积核g规定。比如要求像素f(x-1,y-1)对f(x,y)的影响,就是它本身乘以对应的比例g。 类比吃饭的例子,f(x,y)是t时刻,f(x-1,y-1)是x时刻,x时刻吃的食物到了t时刻还剩下百分之$g(t-x)$,所以 $f(x-1,y-1)$ 对应的比例为 $g(x-(x-1), y-(y-1)) = g(1,1)$,图片像素位置f与卷积核中g的位置并不一一对应,而是要旋转180度。
g函数不等于卷积核:
图像的卷积操作省略了g函数的旋转,直接与卷积核相乘再相加
卷积层
- 卷积核是局部特征的模板
- 不考虑某位置就将其卷积核对应位置设置成零,而要重点考虑某位置,就设置得高一些
- 保留局部特征,得到feature map
- 垂直边界滤波器和水平边界滤波器