티스토리 뷰

Capstone Eng_2020

YOLOv3 기본개념

jainn 2021. 4. 29. 00:20
728x90
객체 탐지

머신러닝에서는 Object Detection은 특정 이미지에서 Bounding Box를 통해 영역을 설정하고, 해당 영역 내 물체의 존재 유무 또는 물체의 종류를 판별하는 것.

 

기존 RCNN계열의 모델들은 일정 수준의 mAP(정확성)는 있으나, 실제 적용하기에 FPS(신속성)가 떨어짐

 

mAP : Mean Average Precision (정확성)

FPS : Frame Per Seconds (속도)

RCNN(Regions with Convolutional Neural Network) : 합성곱 연산 신경망과 같지만, 지역적으로 탐색 부분을 나눈다. 예를 들어, 100x100 이미지가 있다고 하면, CNN이 판별해야하는 정보가 있는 구역(얼굴, 표지판 등)이 25x25 부분에 있을 때, 이미지 모든 부분에서 CNN을 실행시키는 것 보다는, 해당 정보가 있는 부분만 따로 추려내어 CNN을 실행 시키는 것이 나음. R-CNN은 이러한 개념.

 

Precision : True라고 예측한 데이터 중에서 실제 True인 데이터 수 TP/(TP+FP)

Recall : 실제 True인 데이터에서 True라고 예측한 데이터 수 TP/(TP+FN)

Accuracy : 전체 데이터에서 맞게 예측한 데이터 수 (TP+TN)/ALLDATA

IoU : TP/(TP+FP+FN)

Confidence : FP와 TP로 이뤄진 데이터들에 대해 TP가 상위에 많이 있다면, Confidence 레벨을 낮출경우(Threshold) FP를 많이 포함하게 되므로 Precision값이 떨어지고, Recall값이 올라간다.

 

 

YOLO

YOLO란, You Only Look Once의 약자로써, 이미지를 한 번 보는 것으로 object의 종류와 위치를 추측.

단일 네트워크를 통해 여러개의 테두리 상자(Bounding Box)에 대한 객체 확률 계산

 

 

YOLO 모델

Object Detection을 수행하기 위해 고안된 심층 신경망으로써,

테두리상자 조정(Bounding Box Coordinate)과 분류(Classification)를 동일 신경망 구조를 통해 동시에 실행하는 통합인식을 구현하는 것이 가장 큰 특징.

 

YOLO 모델의 절차 및 구조

1. 이미지를 S*S개의 grid cell로 분할.

2. 각 cell마다 하나의 객체 예측.

3. Bounding Box를 통해 객체 위치 및 크기 파악

 

 

 

출처 및 참조

: velog.io/@seongguk/-%ED%95%99%EC%8A%B5%ED%95%9C-%EA%B2%83-%EC%A0%95%EB%A6%AC

wiserloner.tistory.com/481

반응형