728x90
반응형
(아래 내용은 이전에 다른 블로그에 작성한 글을 옮겨온 내용입니다.)
Google Images Download 라는 라이브러리를 하나 소개해드릴까 합니다
딥러닝을 하시는 분들에게 가장 번거롭고 힘든 일 중 하나가 데이터 수집이라 생각됩니다.
아마 자체적으로 크롤러를 개발하시거나 외부 프로그램을 사용하시는 분들이 많이 계실거라 생각하는데
지금 소개해드릴 라이브러리는 제공되는 예제코드와 pip설치만으로 간단하게 이미지를 수집할 수 있습니다.
설치 명령어
pip install google_images_download
이 명령어를 터미널에 입력하시면 에러 없이 잘 설치가 되는 것을 볼 수 있습니다.
그 후 공식문서에서 제공해주는 예제 코드를 보시면
from google_images_download import google_images_download #importing the library
response = google_images_download.googleimagesdownload() #class instantiation
arguments = {"keywords":"Polar bears,baloons,Beaches","limit":20,"print_urls":True} #creating list of arguments
paths = response.download(arguments) #passing the arguments to the function
print(paths) #printing absolute paths of the downloaded images
이런식으로 코드가 작성되어 있습니다.
현재 저 예제코드를 돌리게 되면
한 키워드(검색하고자 하는 키워드, 여기서는 Polar bears / baloons / Beachses 로 3개의 클래스가 있다)당
limit만큼(여기서는 20)의 이미지를 검색 후 저장합니다
정말 좋았던 점은 각 키워드에 해당하는 이미지를 각각의 폴더에 저장해주는 점 이였습니다.
실제로 키워드와 limit값을 고쳐 실행시켜본 결과
이런식으로 아무 이상없이 잘 실행이 된 것을 확인할 수 있었습니다.
728x90
반응형
'Python' 카테고리의 다른 글
유튜브 다운로드 라이브러리 (0) | 2020.08.22 |
---|