반응형
728x170
파이썬의 강력함은 바로 웹 크롤링입니다
웹 크롤링을 위해 먼저 beatuifulsoup4를 설치하겠습니다!
그리고 빠른 접근성을 위해 lxml도 설치해볼게요
먼저 파이썬이 설치된 경로로 이동합니다.
내 컴퓨터 검색에서 python36 이라고 검색하면 나오게 되는데요
경로가 appdata/local/programs/python~ 이렇게 나올거에요
거기서 script 폴더로 이동합니다!
그리고 위와 같이 설치하면 됩니다
pip install beautifulsoup4
pip install lxml
이 상태에서 파이썬 코드를 짜봅시다
파이썬 코드를 짜기 전에 로또 추첨을 해주는 사이트 구조를 파악해야 해요!
로또 사이트를 들어가면 위 사진처럼 분석이 됩니다.
p 태그 안에 img로 감싸져 있어요
그리고 이미지로 번호가 나오고 있습니다.
class 이름은 number이고, alt 값에 로또 번호가 있네요!
회차 779회를 기준으로 진행해볼게요
엄청 짧죠?
이게 끝입니다.
number라는 p 태그 class에 접근해서 link1에 가지고 옵니다.
그리고 link1에 img 태그 값을 가지고 있는 것을 가지고 와서 그중 alt 속성 값을 가지고 오는 거죠!
끝입니다 ㅎㅎ
이제 다음번엔 값을 임의로 넣어서 비교하는 것만 짜면 되겠네요
음 이걸로 로또 번호나 해볼까
반응형
그리드형
'python' 카테고리의 다른 글
파이썬(python) 사용자 입력 input 함수 (0) | 2017.11.06 |
---|---|
파이썬(python) 해시(딕셔너리) 다루기(추가, 수정, 삭제, keys(), values()) (0) | 2017.11.06 |
파이썬(python) 배열(list) 다루기(추가, 삭제, 정렬, 거꾸로, 길이) (0) | 2017.11.03 |
파이썬3 숫자를 문자로 문자를 숫자로 바꾸기 (0) | 2017.11.02 |
파이썬3 문자열 길이를 알아보자 (0) | 2017.11.02 |