如何理解卷积神经网络中的通道(channel)
在传递函数数学模型中他们一般来说须要输出 和 ,即输出地下通道数和输出地下通道数,它代表者甚么原意呢?责任编辑将得出两个形像的认知。
对地下通道的认知能参照上面的这首诗:
【CNN】认知传递函数数学模型中的地下通道 channel
这儿我稍稍归纳呵呵核心理念看法:
对起初输出相片样品的地下通道数 依赖于相片的类别,假如是全彩的,即RGB类别,这时地下通道数一般来说为3,假如是棕色的,地下通道之积1。传递函数顺利完成后,输出的地下通道数 依赖于冷却系统的数目。从那个路径认知,这儿的 增设的是冷却系统的数目。对第几层或是更第二层的传递函数,这时的 是上几层的 , 却是依赖于冷却系统数目。
在第2条我用的是冷却系统,而并非传递函数核,跟原作看法很多相同,即使我指出在这儿用冷却系统叙述更最合适。传递函数核和冷却系统的差别能看我的这首诗 传递函数核(kernel)和冷却系统(filter)的差别
对第1点能参照右图:
这儿输出地下通道四元组3,每一地下通道都须要跟两个传递函数核做传递函数演算,接着将结论相乘获得两个特点图的输出,这儿有4个冷却系统,因而获得4个特点图的输出,输出地下通道之积4。
一般而言特点图的排序可看右图:
再来看呵呵单地下通道的例子:
输出是棕色相片,输出地下通道四元组1,传递函数核有3个,做三次传递函数操作,生成3个特点图,输出地下通道之积3。
单地下通道特点图的排序为:
这儿可能会有人有疑惑为甚么相片的类别是RGB的,它的地下通道数是3呢?
这儿要从排序机怎样识别相片来考虑。在人眼中看到的相片是五颜六色,对排序机来说就只是数字。那么排序机怎样分辨相片颜色呢?——RGB。所有颜色都能用这三种颜色来表示,因而他们只须要三个数字就能表示一种颜色。
右图是我随机选择的几个颜色的RGB表示:
排序机要表示整张相片,是用数字去表示整张相片的所有像素,但是每一像素须要三个数值来表示,于是就有了相片的3地下通道。每一地下通道分别表示RGB三种颜色。
起初的地下通道四元组3,但是有的数学模型地下通道数目多达100多个,怎么认知呢?
他们依然能类比RGB地下通道,对多地下通道他们能看做是颜色表示的更抽象版本,每两个地下通道都表示图像某一方面的信息。