python/Selenium 셀레니움
[selenium] 크롤링 selenium 셀레니움 사용법, 명령어 모음
반응형
#0. 셀레니움 실행을 위한 chrome 드라이버 다운로드
사용중인 chrome 버전으로 드라이버를 다운로드 한다.
크롬 버전 확인 (주소창에 복붙)
chrome://version
크롬 드라이버 다운로드 링크
chromedriver.chromium.org/downloads
#1. 셀레니움 설치 및 import, 기본 코드
1) selenium 설치 pip코드
pip install selenium
2) import 및 기본 코드
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
driver = webdriver.Chrome("./chromedriver")
driver.get("크롤링 할 주소 입력")
driver.implicitly_wait(3)
아래 사진과 같이 위에서 받은 chrome 드라이버를 프로젝트 폴더 에 넣는다면
webdriver.Chrome("크롬 드라이버 경로")
경로란에 ./chromedriver 만 작성하면 된다.
#2. 브라우저 탭 이동/ 앞으로, 뒤로 / 닫기
탭 이동
driver.window_handles[0] #브라우저 탭 객체를 리스트로 반환. [0] 은 첫번재 탭을 의미
driver.switch_to.window(driver.window_handles[0]) #첫번째 탭으로 이동
driver.switch_to.window(driver.window_handles[1]) #두번째 탭으로 이동
driver.switch_to.window(driver.window_handles[2]) #세번째 탭으로 이동
뒤로가기 / 앞으로가기
driver.back() #뒤로가기
driver.forward() #앞으로가기
탭닫기 / 브라우저 닫기
driver.close() #현재 탭 닫기
driver.quit() #브라우저 닫기
#3. (xpath / class_name / id / css_selector ...)
원하는 부분의 xpath 등을 가져와서 클릭하여 페이지 이동과 같은
행동을 할 수 있다.
driver.find_element_by_xpath('//*[@id="main-area"]/div[7]/a[2]') #xpath 로 접근
driver.find_element_by_class_name('ico_search_submit') #class 속성으로 접근
driver.find_element_by_id('k_btn') #id 속성으로 접근
driver.find_element_by_link_text('회원가입') #링크가 달려 있는 텍스트로 접근
driver.find_element_by_css_selector('#account > div > a') #css 셀렉터로 접근
driver.find_element_by_name('join') #name 속성으로 접근
driver.find_element_by_partial_link_text('가입') #링크가 달려 있는 엘레먼트에 텍스트 일부만 적어서 해당 엘레먼트에 접근
driver.find_element_by_tag_name('input') #태그 이름으로 접근
이중으로 find_element 를 사용 할 수 있다.
#input 태그 하위태그인 a 태그에 접근
driver.find_element_by_tag_name('input').find_element_by_tag_name('a')
#xpath 로 접근한 엘레먼트의 안에 join 이라는 속성을 가진 tag 엘레먼트에 접근
driver.find_element_by_xpath('/html/body/div[3]/form//span[2]').find_element_by_name('join')
#4. 클릭 .click()
driver.find_element_by_xpath('//*[@id="main-area"]/div[7]/a[2]').click()
#5. 텍스트 입력/엔터 .send_keys('텍스트') / .send_keys(Keys.ENTER)
driver.find_element_by_name('query').send_keys('보라매역')
driver.find_element_by_name("query").send_keys(Keys.ENTER)
#6. 텍스트 삭제 .clear()
driver.find_element_by_name("query").clear()
#7. iframe 지정 switch_to.frame
#iframe 지정
element = driver.find_element_by_tag_name('iframe')
#프레임 이동
driver.switch_to.frame(element)
#프레임에서 빠져나오기
driver.switch_to.default_content()
#8. 팝업창 이동 / 수락 / 거절
#경고창으로 이동
driver.switch_to.alert
from selenium.webdriver.common.alert import Alert
Alert(driver).accept() #경고창 수락 누름
Alert(driver).dismiss() #경고창 거절 누름
print(Alert(driver).text # 경고창 텍스트 얻음
#9. 스크롤 내리기
#브라우저 스크롤 최하단으로 이동
driver.execute_script('window.scrollTo(0, document.body.scrollHeight);')
#10. 스크린샷
#캡쳐할 엘레먼트 지정
element = driver.driver.find_element_by_class_name('ico.target')
#캡쳐 (name에는 파일명)
element.save_screenshot('name.jpg')
#11. 오류 예외 처리 try , except문
클릭이나 프레임 이동시 에러가 발생 할 경우 사용할 수 있다
try:
print('') #실행할 코드
except:
pass #오류 발생시 실행할 코드
pass를 사용하면 오류를 회피한다.
#예시
try:
name = driver.find_element_by_tag_name('table')
except NoSuchElementException: #except 오류문(해당 오류가 발생시 실행)
print(" [예외 발생] 표 없음 ")
continue
except 오류문2: #오류문 여러개 사용가능
else: #오류가 없을시 try문 다음으로 실행한다.
print('오류가 없어요')
#12. 여러가지 오류문 모음
여러가지 오류 모음
# NoAlertPresentException 경고창 관련 명령어를 실행했으나 현재 경고창이 뜨지 않음
# NoSuchElementException 엘레먼트 접근하였으나 없음
# TimeoutException 특정한 액션을 실행하였으나 시간이 오래 지나도록 소식이 없음
# ElementNotInteractableException 엘리먼트에 클릭등을 하였으나 클릭할 성질의 엘리먼트가 아님
# NoSuchWindowException 해당 윈도우 없음
# NoSuchFrameException 해당 프레임 없음
반응형
'python > Selenium 셀레니움' 카테고리의 다른 글
[Selenium+bs4] 네이버 카페 검색창, iframe 크롤링 방법, 네이버 로그인 방법 (15) | 2021.04.28 |
---|
댓글