[YOLOv3 리뷰] YOLOv3: An Incremental Improvement (arXiv 18)

Notice

Recent Posts

Recent Comments

작심삼일

Deep Learning/Vision

yun_s 2022. 8. 4. 10:11

728x90

이 논문은 어투도 논문같지 않고 보고서같은 느낌이 강하다.

이전처럼 논문을 자세하게 쓰기보다는 간략한 정리만 쓰려고 한다.

YOLOv3는 YOLOv2와 많은 것이 비슷하다. 이와 다른 점만 간단히 써보려고 한다.

Class Prediction

Softmax대신 binary cross-entropy loss를 사용하며 logistic classifier를 사용했다.

"Woman"과 "Person"처럼 겹치는 의미가 존재할 때 softmax는 한가지 답만 내놓을 수 있지만, 새로운 방법처럼 학습하게 되면 multi-label에서 더 학습이 잘된다.

Predictions Across Scales

3 different scale로 박스를 추측한다.

그래서 output tensor는 $N \times N \times [ 3 * (4+1+80)]$이 된다.

여기서 3은 scale, 4는 YOLOv2에서도 사영되는 bounding box offsets, 1은 objectness prediction, 80은 class prediction이 되겠다.

또한, feature map을 각각 다른 layer에서 두 번 뽑아서 합쳐 사용한다.

그로 인해 더 많은 정보를 얻을 수 있다.

YOLOv2처럼 k-means clustering을 사용하지만, 이번에는 k=9로 했다.

Feature Extractor

Darknet-19에 층을 더 쌓아서 만든 Darknet-53을 사용했다.

Darknet-53의 성능은 ResNet-152보다 뛰어나다.

Inference

처음에는 그래프를 잘못 넣은 줄 알았다.

하지만 YOLOv3가 매우 빠르다는 것을 효과적으로 보여주기 위해 아래 그림처럼 그래프를 그렸다.

뭐 보다싶이 속도도 빠르고 성능도 매우 좋다.

Redmon, Joseph, and Ali Farhadi. "Yolov3: An incremental improvement." arXiv preprint arXiv:1804.02767 (2018).

728x90

[FFC 리뷰] Fast Fourier Convolution (NIPS 20) (0)	2022.08.08
[YOLOv4 리뷰] Optimal Speed and Accuracy of Object Detection (arXiv 20) (0)	2022.08.07
[YOLOv2 리뷰] YOLO9000: Better, Faster, Stronger (CVPR 17) (0)	2022.08.02
[YOLO v1 리뷰] You Only Look Once: Unified, Real-Time Object Detection (CVPR 16) (0)	2022.07.29
[CycleGAN 리뷰] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks (ICCV 17) (2)	2021.09.14

'Deep Learning/Vision' Related Articles

Comments