728x90
반응형
자바 OCR에 대한 오픈소스로 Tesseract를 많이 사용합니다.
이에 대한 링크는 https://sourceforge.net/projects/tess4j/ 를 참고하여 받으시면 됩니다.
이후 사용을 하던 중 처음 사용하시면 한글에서는 글자가 깨지는 현상이 발생합니다.
초기 tess4j에는 영어에 대한 언어만 지원하고 있습니다.
https://github.com/UB-Mannheim/tesseract/wiki 에 들어가 원하시는(한글 등) 언어팩을 설치하시기 바랍니다.
그 후 언어설정에 대한 처리로 "Tesseract.java"파일 안에 코드를 보게 됩니다.
이 부분에서 language에 대한 값을 "kor" 로 고쳐야 합니다.
TIP : 언어를 혼용하여 사용하고 싶으면 "eng + kor" 이런식으로 + 를 붙여 넣으시면 됩니다.
728x90
반응형