이전 글에 이어서 EasyOCR을 저는 어떻게 사용했는지 설명하도록 하겠습니다. 이전 글 developer-youn.tistory.com/45 우리 EasyOCR로 한번 가자(1) OCR을 사용해야 하는 상황에서 만약 장비와 시간의 여유가 있다면 Python으로 EasyOCR을 한 번쯤 사용해보는 것도 좋을 것 같습니다. github.com/JaidedAI/EasyOCR 위 주소는 EasyOCR 공식github 주소입니다. 1... developer-youn.tistory.com 기본 코드 구조는 아래와 같습니다. import easyocr reader = easyocr.Reader(['ko','en']) # need to run only once to load model into memory resul..
OCR
OCR을 사용해야 하는 상황에서 만약 장비와 시간의 여유가 있다면 Python으로 EasyOCR을 한 번쯤 사용해보는 것도 좋을 것 같습니다. github.com/JaidedAI/EasyOCR 위 주소는 EasyOCR 공식github 주소입니다. 1. 그래서 EasyOCR이 뭔데? 우선 EasyOCR에 대해서 설명을 적어봅니다 EasyOCR은 OCR 오픈소스로 Detection부분과 Recognition부분으로 나누어져 있으며 Text Detection은 CRAFT를 사용하고 Recognition은 CRNN사용합니다. Framework는 모든 소스가 pytorch로 작성되어있습니다. pytorch는 tensorflow처럼 딥러닝을 위한 프레임워크로 tensorflow보다 좀 더 pythonic하게 코드를..
자바 OCR에 대한 오픈소스로 Tesseract를 많이 사용합니다. 이에 대한 링크는 https://sourceforge.net/projects/tess4j/ 를 참고하여 받으시면 됩니다. 이후 사용을 하던 중 처음 사용하시면 한글에서는 글자가 깨지는 현상이 발생합니다. 초기 tess4j에는 영어에 대한 언어만 지원하고 있습니다. https://github.com/UB-Mannheim/tesseract/wiki 에 들어가 원하시는(한글 등) 언어팩을 설치하시기 바랍니다. 그 후 언어설정에 대한 처리로 "Tesseract.java"파일 안에 코드를 보게 됩니다. 이 부분에서 language에 대한 값을 "kor" 로 고쳐야 합니다. TIP : 언어를 혼용하여 사용하고 싶으면 "eng + kor" 이..