[Crawling] 이미지 태그 수집 후 폴더 저장

Python/Crawling

[Crawling] 이미지 태그 수집 후 폴더 저장

퓨어맨 2022. 6. 9. 08:41

from selenium import webdriver as wb
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup as bs
import time

import os # 파일시스템을 위한 라이브러리 ex)파일, 폴더를 생성, 삭제, 존재여부 파악

from urllib.request import urlretrieve as urlre # 이미지경로를 파일로 저장

# 폴더생성
if not os.path.isdir('./이미지3'):
    os.mkdir('./이미지3')
    print('폴더생성')
    
# 웹페이지 제어
url = 'https://search.naver.com/search.naver?sm=tab_hty.top&where=image&query=%ED%8F%AC%EB%A9%94%EB%9D%BC%EB%8B%88%EC%95%88&oquery=%EC%9B%B0%EC%8B%9C%EC%BD%94%EA%B8%B0&tqi=hoKcJsp0J1sssAXOgl8ssssstqZ-193241'
driver = wb.Chrome()
driver.get(url)

# 스크롤 제어
body = driver.find_element_by_css_selector('body')

for i in range(5):
    body.send_keys(Keys.PAGE_DOWN)
    time.sleep(0.3)
    
# 이미지 태그 수집후 이미지3 폴더에 저장
soup = bs(driver.page_source, 'lxml')
img = soup.select('img._image._listImage')

img_list = []

for i in img:
    try:
        img_list.append(i['data-lazy-src'])
    except:
        img_list.append(i['src'])
        
for i in range(len(img_list)):
    urlre(img_list[i], f'./이미지3/{i}.jpg')
    time.sleep(0.1)
 
# urlretrieve(src값, 경로)
urlre(img_list[0], './이미지3/1.jpg')

urlre(img_list[0], './이미지3/1.jpg') 결과

이미지 폴더3에 이미지 저장

'Python > Crawling' 카테고리의 다른 글

[Crawling] 스타벅스 매장 주소 가져오기 (0)	2022.06.09
[Crawling] 탭 전환 (0)	2022.06.09
[Crawling] 지마켓 best 품목(상품명,가격,원산지) (0)	2022.06.08
[Crawling] 유튜브 크롤링(제목 조회수 가져오기) (0)	2022.05.30
[Crawling] 한솥 제품설명 가져오기 (0)	2022.05.25

현재글[Crawling] 이미지 태그 수집 후 폴더 저장

기존에 배웠던 코딩을 처음부터 다시 배우는 중

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Re:제로부터 시작하는 코딩생활

[Crawling] 이미지 태그 수집 후 폴더 저장

'Python > Crawling' 카테고리의 다른 글

'Python/Crawling'의 다른글

티스토리툴바

[Crawling] 이미지 태그 수집 후 폴더 저장

'Python > Crawling' 카테고리의 다른 글

'Python/Crawling'의 다른글

관련글

티스토리툴바