CNN
-
[논문] CNN - AlexNet, 2012개발/머신러닝-딥러닝 2022. 3. 8. 18:01
제가 이해한 내용을 정리한 글입니다. 오류가 있으면 고쳐주세요! 2012년에 CNN을 사용해 ILSVRC에서 압도적으로 1등한 모델. 기반이 되는 논문은 AlexNet 이다. 배경 기계학습의 성능을 높이기 위해서는 큰 데이터셋이 필요하다. 큰 데이터를 잘 학습하기 위해서는 용량이 큰 모델이 필요하다. CNN은 비슷한 규모의 피드포워드 신경망보다 간선과 파라미터가 적으므로 학습이 쉽다. (물론 best-perfomance는 조금 떨어질 수 있다.) 모델 특징 모델은 이미지의 속성을 찾는 5개의 Conv층과 속성으로 이미지를 분류하는 3개의 FC층이 있다. 여기서 Conv층을 조금이라도 제거한다면 성능이 떨어짐을 확인했다. 두 개의 GPU - 피드포워드 신경망보다 적지만 여전히 GPU로 학습하기에는 용량이 ..