Segmentation/Detection 방법

cornpip

|2024. 4. 13. 00:30

classification 신경망에서 FC layer 대신에 Fully Convolution을 거친다.

Fully Convolution으로 마무리하면 위치 정보를 그대로 가지고 있고 입력 크기가 자유로워진다.

(fc layer는 이전 레이어의 모든 뉴런과 연결되어 있고, 입력 size가 변경되면 가중치 수도 변경되기 때문에, 입력 size가 고정되어 있다.)

결과적으로 위치 정보를 가진 채로 classification을 할 수 있고, 해당하는 픽셀 영역에 어떤 물체가 있는지 알 수 있다.

다만, Conv을 거치면서 spatial dimension이 줄어들었기 때문에, 다시 늘려주기 위한 deconvolution, unpooling 등의 upsample 과정을 거친다.

그러고 나면 이미지에 대한 semantic segmentation을 얻을 수 있다.

이밖에도 다양한 segmentation 방법과 종류가 있다.

목표 - bounding box와 함께 객체를 찾아야 한다.

수행해야 하는 2가지 Task

위 2가지를 동시에 수행하면 One-Stage-Detector 모델,

2가지를 한 단계씩 순차적으로 진행하면 Two-Stage-Detector 모델이다.

ex) One-Stage-Detector - YOLO, SSD, RetinaNet

ex) Two-Stage-Detector - R-CNN, Mask R-CNN, Cascade R-CNN

detection 모델에 따라 2가지 task를 수행하기 위한 다양한 접근과 방법이 있다.

딥러닝 기초 다지기

부스트코스 무료 강의

티스토리툴바