세로형
Recent Posts
Recent Comments
Link
04-20 21:32
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Archives
Today
Total
관리 메뉴

꿈 많은 사람의 이야기

파이썬 크롤링으로 로또번호를 알아보자~ 본문

python

파이썬 크롤링으로 로또번호를 알아보자~

이수진의 블로그 2017. 11. 6. 10:45

파이썬의 강력함은 바로 웹 크롤링입니다

웹 크롤링을 위해 먼저 beatuifulsoup4를 설치하겠습니다!

그리고 빠른 접근성을 위해 lxml도 설치해볼게요

먼저 파이썬이 설치된 경로로 이동합니다.

내 컴퓨터 검색에서 python36 이라고 검색하면 나오게 되는데요

경로가 appdata/local/programs/python~ 이렇게 나올거에요

거기서 script 폴더로 이동합니다!

그리고 위와 같이 설치하면 됩니다

pip install beautifulsoup4

pip install lxml

이 상태에서 파이썬 코드를 짜봅시다

 

파이썬 코드를 짜기 전에 로또 추첨을 해주는 사이트 구조를 파악해야 해요!

 

로또 사이트를 들어가면 위 사진처럼 분석이 됩니다.

p 태그 안에 img로 감싸져 있어요

그리고 이미지로 번호가 나오고 있습니다.

 

class 이름은 number이고, alt 값에 로또 번호가 있네요!

 

회차 779회를 기준으로 진행해볼게요

엄청 짧죠?

이게 끝입니다.

number라는 p 태그 class에 접근해서 link1에 가지고 옵니다.

그리고 link1에 img 태그 값을 가지고 있는 것을 가지고 와서 그중 alt 속성 값을 가지고 오는 거죠!

 

끝입니다 ㅎㅎ

이제 다음번엔 값을 임의로 넣어서 비교하는 것만 짜면 되겠네요

음 이걸로 로또 번호나 해볼까

 

 

반응형
그리드형
Comments