아래 글과 이어집니다.
https://developer-youn.tistory.com/72
1. 검출이 잘 되지 않습니다. 이제 뭘 더 해봐야 할까요?
자.. 이제 훈련은 다 했는데 생각만큼 검출이 잘 되지 않을 수 있습니다. 실은 이건 정답이 있는 게 아니라 어떻게든 원인을 분석해서 잘 돌파해야 합니다.
학습 데이터로 넣은 데이터가 부실했는지 확인이 필요합니다. 컴퓨터에게 주입식 교육을 하기 위해서는 계속해서 다양한 데이터를 알려줘야 하는데 충분한 데이터가 모였는지 확인해야 합니다. 실제 산업군에서 사용되는 데이터셋은 기본적으로 하나의 클래스에 몇십만 개의 데이터가 있습니다. 그리고 정말 다양하게 해줘야 합니다. 다양하게 하기 위해 각 학습 API, Model에서는 다양한 Augmentation옵션을 제공합니다. 사진을 회전, 반전시키거나 모자이크 처리, 색상 빼기 등 다양한 옵션들이 존재하므로 체크해서 필요한 만큼 넣어서 진행하면 될 것 같습니다. 만약 그래도 안 잡힌다면 이미지가 들어가기 전 여러 상황을 고려해서 사전에 이미지를 처리하여(예를 들어 이진화하여 진행하는 등) 하는 것도 고려해보시기 바랍니다.
2. 아직도 용어들을 잘 모르겠어요. 너무 생소한 분야예요.
맞습니다. 저도 잘 모릅니다. 계속해서 연구가 되어가는 분야입니다. 처음 기초 용어들에 대한 개념을 잡을 때 참고했던 좋은 사이트가 있어서 링크를 걸겠습니다.
https://tykimos.github.io/2017/03/25/Dataset_and_Fit_Talk/
위 링크는 케라스 기준이지만 프레임워크만 다를 뿐 모두 공통된 내용입니다. 잘 정독해보면 좋을 것 같습니다.
그리고 Object detection에 대해 잘 설명을 한 블로그입니다.
3. 위에서 딥러닝은 잘 모르면서 왜 성능이 잘 안 나오냐고 물어볼 때 어떻게 해야 하죠? 저도 잘 모르는데..
딥러닝을 하는 데 있어 가장 큰 공수가 들어가는 부분은 데이터셋 수집 부분일 거라 생각합니다. 모델이야 이미 있는 모델을 가져다 사용하지만 데이터는 일일이 모든 데이터를 레이블링 해야 하고 그 데이터를 토대로 계속해서 검출을 시도하고.. 고생이 많으십니다!
일단 데이터가 부족하다고 설명을 해야 합니다. 이게 설득이 잘 안 될 수도 있습니다. 근데 어떻게든 설득을 해야 합니다.
3-1. 데이터셋으로 집어넣은 데이터에 대해 검출을 시도했는데 못 잡습니다. 정상인가요?
네 정상입니다. 사람에게 스쳐 지나가듯 뭔가를 보여주고 다음에 동일한 사진에서 뭔가를 구분하라고 했을 때 잘 못할 수도 있습니다. 같은 이치라고 보시면 됩니다. 딥러닝은 들어간 데이터들에 대해 평균치를 구해 범위에 들어오면 정답, 아니면 오답인데 충분히 가능한 상황입니다.
4. 마무리하며
음.. 어떻게 마무리하지
다들 고생이 많으십니다. 우리 함께 힘내요.
'Python > 딥러닝 (Deep-Learning)' 카테고리의 다른 글
Product에 Object Detection을 도입하고 싶은데 딥러닝은 하나도 모를때 읽으면 괜찮을만한 글(1) (2) | 2022.02.28 |
---|---|
LeNet-5 Pytorch 코드 구현(이라 쓰고 질문이라고 읽는다.) (6) | 2021.08.28 |
우리 EasyOCR로 한번 가자(2) (6) | 2021.04.18 |
우리 EasyOCR로 한번 가자(1) (2) | 2021.04.13 |
Tensorlfow Object Detection API 사용 중 발생한 에러 정리 (0) | 2021.03.25 |