유진정의 기록

[KHUDA 5기 CV] 3주차 본문

개인공부/Computer Vision

[KHUDA 5기 CV] 3주차

알파카유진정 2024. 3. 31. 17:00

7강 CNN: Convolutional Neural Networks

Convolution Layer

  • 합성곱 계층은 3차원으로 구성된 볼륨에서 작동
  • 각 레이어는 활성화된 볼륨을 받아들여 새로운 활성화된 볼륨을 생성
  • 필터를 이미지 위에서 이동시켜 점곱 연산을 수행
  • 각 필터는 하나의 활성화 맵을 생성
  • 이러한 합성곱 계층을 통해 이미지를 새로운 형태의 표현으로 변환

Pooling Layer

  • 풀링 계층은 볼륨의 표현을 줄이고 관리하기 쉬움
  • 각 활성화 맵에 대해 독립적으로 작동
  • 최대 풀링은 각 영역에서 가장 높은 값을 선택하여 작동

Fully Connected Layer (FC Layer)

  • 합성곱 및 풀링 계층을 거친 후에는 결과를 플래튼하여 완전 연결 계층에 전달합니다.
  • 이를 통해 클래스를 구분하는 softmax에서 결과

Case Study

  • LeNet-5, AlexNet, ZFNet, VGGNet, GoogLeNet, ResNet 등 

8강 Localization 및 Detection: 객체 위치 파악과 탐지

객체 위치 파악 및 탐지

  • Classification, Classification + Localization, Object Detection, Instance Segmentation

Localization as Regression

  • 객체 위치를 회귀로 처리하는 방법으로, 이미지 내 모든 위치에 대해 회귀를 수행.

Detection as Classification

  • 객체 탐지를 분류 문제로 취급하여, blob 형태의 영역을 찾음.
  • Region Proposal을 사용하여 가능성 있는 영역을 선택

Region Proposals

  • 객체 탐지를 위한 후보 영역을 찾는 방법으로, blob 형태의 영역을 찾아냄.
  • Selective Search와 같은 알고리즘이 사용

R-CNN (Region-based Convolutional Neural Network)

  • 객체 탐지를 위해 Region Proposal과 CNN을 결합한 방법

Fast R-CNN 및 Faster R-CNN

  • R-CNN의 성능을 향상시킨 방법으로, 빠른 속도와 정확도를 달성

YOLO (You Only Look Once)

  • 객체 탐지를 회귀로 처리하는 방법으로, 이미지를 한 번만 처리하여 객체 탐지를 수행합니다.
    • 합성곱 계층은 3차원으로 구성된 볼륨에서 작동
    • 각 레이어는 활성화된 볼륨을 받아들여 새로운 활성화된 볼륨을 생성
    • 필터를 이미지 위에서 이동시켜 점곱 연산을 수행
    • 각 필터는 하나의 활성화 맵을 생성
    • 이러한 합성곱 계층을 통해 이미지를 새로운 형태의 표현으로 변환
    Pooling Layer
    • 풀링 계층은 볼륨의 표현을 줄이고 관리하기 쉽게 합니다.
    • 각 활성화 맵에 대해 독립적으로 작동합니다.
    • 최대 풀링은 각 영역에서 가장 높은 값을 선택하여 작동합니다.
    Fully Connected Layer (FC Layer)
    • 합성곱 및 풀링 계층을 거친 후에는 결과를 플래튼하여 완전 연결 계층에 전달합니다.
    • 이를 통해 클래스를 구분하는 softmax에서 결과를 얻을 수 있습니다.
    다양한 CNN 모델 사례
    • LeNet-5, AlexNet, ZFNet, VGGNet, GoogLeNet, ResNet 등 다양한 CNN 아키텍처가 있습니다.
    8강 Localization 및 Detection: 객체 위치 파악과 탐지
    • Classification, Classification + Localization, Object Detection, Instance Segmentation
    Localization as Regression
    • 객체 위치를 회귀로 처리하는 방법으로, 이미지 내 모든 위치에 대해 회귀를 수행
    Detection as Classification
    • 객체 탐지를 분류 문제로 취급하여, blob 형태의 영역을 찾음.
    • Region Proposal을 사용하여 가능성 있는 영역을 선택.
    Region Proposals
    • 객체 탐지를 위한 후보 영역을 찾는 방법으로, blob 형태의 영역을 찾아냄.
    • Selective Search와 같은 알고리즘이 사용
    R-CNN (Region-based Convolutional Neural Network)
    • 객체 탐지를 위해 Region Proposal과 CNN을 결합한 방법.
    Fast R-CNN 및 Faster R-CNN
    • R-CNN의 성능을 향상시킨 방법으로, 빠른 속도와 정확도를 달성.
    YOLO (You Only Look Once)
    • 객체 탐지를 회귀로 처리하는 방법으로, 이미지를 한 번만 처리하여 객체 탐지를 수행.

'개인공부 > Computer Vision' 카테고리의 다른 글

[KHUDA 5기 CV] 2주차  (0) 2024.03.22
[KHUDA 5기 CV] 1주차  (0) 2024.03.15