从相关函数的数学形式出发理解卷积的特征识别功能
卷积对于初学者之所以难以理解,是因为它包含了几种不同的运算(操作)——翻转、乘法、平移、加法。很多科普作品之所以有隔靴搔痒之感,是因为初学者难以理解为什么这么多不同操作的组合,最终能实现特征识别的效果。这里的“特征”具有丰富的含义,可以是物理世界中的图像、音频等形式的信号,也可以是人类无法直接感知的微波信号,可以是一维、二维和多维的信号。可以从相关函数的意义及其数学形式来理解为什么这种数学形式(操作)可以辨别特征,计算相似度,其它不同形式和维度的信号的特征捕捉,其卷积过程是类似的。将卷积与ANN相结合,形成的CNN,可以具有强大的识别能力。这里有两个问题,一是卷积是最优、最高效的特征识别方式吗?对精度要求在什么水平时,适合运用它;二是人类对不同类型信号的处理和模式识别,是否是卷积,或类似于卷积的运算方式?
还没人转发这篇日记