[Paper] DETR - End-to-End Object Detection with Transformer

• DETR은 Facebook AI 팀에서 개발한 객체 탐지 모델로, Transformer 방식을 적용하여 기존 Detection Network의 초매개변수를 제거하고 간단한 네트워크 구성을 사용합니다.
• 네트워크는 Convolution Neural Network(ResNet), Transformer Encoder, Transformer Decoder, Feed-Forward Network(FFN)의 4단계로 구성되어 있으며, 객체 탐지뿐만 아니라 Panoptic Segmentation 분야에서도 좋은 성능을 보여줍니다.
• DETR은 기존의 Object Detection 방식과 다르게 Transformer 구조를 활용하여 물체를 탐지하고 분류하는 방식을 제안합니다.
• 실험 결과, 대부분의 경우에서 DETR은 더 적은 파라미터 개수로도 Faster-RCNN보다 높은 성능을 보이지만, 작은 물체에 대해서는 상대적으로 약한 모습을 보입니다.

북마크
공유하기
신고하기