커널은 기능 맵에 어떻게 적용되어 다른 기능 맵을 생성합니까? : 4 개의 다른 커널 (크기 ) 이있는

컨볼 루션 신경망의 컨볼 루션 부분을 이해하려고합니다. 다음 그림을 보면 :

여기에 이미지 설명을 입력하십시오

4 개의 다른 커널 (크기 ) 이있는 첫 번째 회선 레이어를 이해하는 데 아무런 문제가 없습니다. 크기 는 입력 이미지와 함께 4 개의 기능 맵을 얻습니다.

k×k

내가 이해하지 못하는 것은 4 개의 기능 맵에서 6 개의 기능 맵으로 이동하는 다음 회선 레이어입니다. 이 계층에 6 개의 커널 (결과적으로 6 개의 출력 기능 맵 제공)이 있다고 가정하지만 이러한 커널은 C1에 표시된 4 개의 기능 맵에서 어떻게 작동합니까? 커널은 3 차원입니까, 아니면 2 차원이며 4 개의 입력 기능 맵에서 복제됩니까?



답변

커널은 3 차원으로 너비와 높이를 선택할 수 있으며 깊이는 입력 레이어의 맵 수와 동일합니다.

그것들은 확실히 2 차원이 아니며, 동일한 2D 위치에서 입력 피처 맵에 복제됩니다! 즉, 커널은 입력 기능 맵에서 하나의 동일한 가중치를 사용하기 때문에 주어진 위치에서 입력 기능을 구별 할 수 없습니다!


답변

레이어와 커널간에 일대일 대응이 반드시 필요한 것은 아닙니다. 특정 아키텍처에 따라 다릅니다. 게시 한 그림은 S2 레이어에 이전 레이어의 모든 기능 맵, 즉 서로 다른 가능한 기능 조합을 결합하는 6 개의 기능 맵이 있음을 나타냅니다.

더 이상의 언급이 없으면 더 이상 말할 수 없습니다. 예를 들어이 논문을보십시오


답변

Yann LeCun의 “문서 인식에 적용된 그라디언트 기반 학습”의 표 1 및 섹션 2a는이를 잘 설명합니다. http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf 5×5 컨볼 루션의 모든 영역이 2 차 컨볼 루션 레이어를 생성하는 데 사용됩니다.


답변

이 기사는 도움이 될 수 있습니다 : 깊은 학습에 회선을 이해 함으로써 팀 Dettmers 년 3 월 26 일부터

그것은 첫 번째 컨볼 루션 레이어 만 설명하기 때문에 실제로 질문에 대답하지는 않지만 CNN의 컨볼 루션에 대한 기본적인 직관에 대한 좋은 설명이 포함되어 있습니다. 또한 컨볼 루션에 대한 더 깊은 수학적 정의를 설명합니다. 질문 주제와 관련이 있다고 생각합니다.