본문 바로가기
공허의 유산/사상의 도구

셀레니엄을 이용한 데이터 수집 환경 구축

by 바른생활머시마 2023. 8. 27.
728x90
반응형

python 개발 환경을 구축하고,

https://learn-and-give.tistory.com/128

 

Python 개발 환경 구축

뭐 좀 해보려고 하면 생각이 안나서 다시 공부부터 해야 하는 억울한 나이.ㅋ 겸사겸사 다음에 다시 공부 할 때 도움을 받고자 간단히 정리 해 보자. 셀리니움으로 크롤러 만들어서 데이터 좀 모

learn-and-give.tistory.com

 

이제 셀리니엄을 이용해서 데이터 수집 환경을 만들어 보자.

요것도 다른 분 포스트를 한번 참고해서 후다닥 따라가 보면 옛 생각이 나겠지.

https://jaeseokim.dev/Python/python-Selenium%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%9C-%EC%9B%B9-%ED%81%AC%EB%A1%A4%EB%A7%81-%EA%B0%84%EB%8B%A8-%EC%82%AC%EC%9A%A9%EB%B2%95-%EB%B0%8F-%EC%98%88%EC%A0%9C/

 

[python] Selenium을 이용한 웹 크롤링 - 간단 사용법 및 예제

Selenium 이란? 다양한 언어에서 웹 드라이버를 통한 웹 자동화 테스트를 지원하는 라이브러리 입니다. 여기서 웹 자동화 테스트에서만 국한 되는 것이 아닌 웹에서 자동화를 통한 다양한 작업을

jaeseokim.dev

 

Selenium 설치

pip install로 간단히 설치 가능한데, selenium 철자를 주의.ㅋ

겸사겸사  pip도 업데이트 하고~

 pip로 설치 시 권한이 없다고 뜨면, VS Code 실행 할 때 관리자 권한으로 실행해야 함.

이제 다시 설치

pip install selenium

잘 설치 되었고.

 

브라우져 드라이버 설치

이제 브라우져를 제어 할 드라이버를 설치 합니다.

크롬으로 고고씽.

https://chromedriver.chromium.org/downloads

 

ChromeDriver - WebDriver for Chrome - Downloads

Current Releases If you are using Chrome version 115 or newer, please consult the Chrome for Testing availability dashboard. This page provides convenient JSON endpoints for specific ChromeDriver version downloading. For older versions of Chrome, please se

chromedriver.chromium.org

프로젝트 폴더 상위에 다운로드 해 두되, git에 추가는 안되도록 ingore에 등록

 

뭐가 잘 안되서 찾아보니, 브라우져 버젼에 맞게 드라이버를 설치해야 하는군요.

https://chancoding.tistory.com/136

 

[파이썬] Selenium 셀레니움 설치하기 / 크롬 드라이버 설치하기

목차 1. Python Selenium 설치하기 다른 라이브러리를 설치하는 것과 동일합니다. pip 또는 conda 명령어를 사용해서 설치해주세요. pip install selenium conda install selenium 2. Chrome Driver 설치하기 Selenium을 사

chancoding.tistory.com

설치 된 크롬의 버젼은~

116 버젼은 아직 정식 릴리즈 지원은 안되고 있나 보군요.

딱 맞지는 않지만, 가장 가까운 걸로 해보자.

예전에는 드라이버 경로를 넣어줬는데 바뀐건지 그냥 방법이 다른 건지 모르겠네요.

그대로 다행히 최신 드라이버를 py 소스 코드와 함께 넣고 테스트 해 보니, 잘 작동하네요.

타겟 사이트가 잠시 열렸다가 프로그램이 종료 되면서 브라우져도 닫힙니다.

import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

browser_driver_path = 'C:/Study/c4k/sellenium/chromedriver_win32/chromedriver.exe'
driver = webdriver.Chrome()

# 수집 대상 사이트
target_base_URL = 'https://likms.assembly.go.kr/bill/billVoteResult.do#21_________10_1'
driver.get(target_base_URL)

 

이제 기본적인 환경은 되었고, 수집 할 정보를 보면서 작성 해 보도록 하자.

728x90
반응형

댓글