목록크롤링 (5)
꿈 많은 사람의 이야기
벌써 이것을 진행한지는 꽤 되었지만 이 블로그에는 올리지 않아서 다시 올립니다~원본 게시글은https://post.naver.com/viewer/postView.nhn?volumeNo=16628864&memberNo=34022432 여기에 올려져 있습니다~파이썬으로 텍스트 데이터를 분석하는 작업인데 소셜 네트워크 서비스(SNS) 데이터를 활용합니다 타겟 데이터는 비트코인, 이더리움 등의 암호화폐(가상화폐)로 유명한 오픈 커뮤니티인 코인판(coinpan)을 활용합니다코인판에서 나온 메디블록(mediblock) 게시글을 분석해서 메디블록과 관련된 텍스트 데이터를 분석해보려고 합니다!참고로 이 분석은 벌써 시간이 반년정도 되었습니다.지금과는 이슈가 다를 것입니다.약올림이라는 어플이 나왔을 때 했던 프로젝트고본..
지난 포스팅에 지진 알림을 만들어보는 대략적인 컨셉을 잡아보았습니다일단은.. 파이썬 beautifulsoup을 사용하려고 했는데 순수 beautifulsoup은 먹히지가 않았습니다.그래서 파이썬 뷰티플수프와 셀레니움을 함께 이용했습니다아.. 속도가 좀 많이 느리네요 그래서아무튼 대략적인 프로그램은 완성되었습니다 ㅎㅎ 게시글을 가져오면 저 위의 키워드와 매칭을 해봅니다저 키워드가 있으면예를 들어 ( 방금 포항에서 지진이 일어났어)(경주인데 흔들린 것 같은데?)등의 흔들, 지진 등의 키워드가 속해져 있으면 지진이 일어났다고 가정을 하면서 진행됩니다 그리고 시간은 1시간 30분으로 잡았습니다지진이 일어나도 생각보다 많이 글이 안올라오더군요이게 지진의 강도가 쎄면 많이 올라오는데, 약하면 많이 올라오지 않아서 ..
최근 지진에 대해서 계속 이슈가 나오고 있습니다 얼마전 포항에서도 지진이 터졌구요 해외에서도 대만 지진 등 지속적인 지진에 대한 이슈가 터져나오고 있습니다 그래서 공부도 해볼겸 파이썬 웹 크롤링을 이용해서 야매? 지진 알람계를 만들어 볼까 생각중입니다.방법은 제가 지진계가 있는 것도 아니고 해서 우회적인 방법을 이용했어요바로 지진 커뮤니티(갤러리)를 이용하는 것이죠 디시인사이드의 지진갤러리를 이용하려고 합니다 여기는 지진이 일어나면 게시글이 엄청 올라옵니다그래서 이 게시물들을 크롤링해서 키워드 분석 후 알람을 울리게 하려는 방식으로 해보려 합니다 디씨인사이드를 사용한 이유는 가장 활발한 갤러리이기 때문입니다다른 여타 지진 갤러리보다 여기가 제일 활발합니다그리고 기술적인 이유도 있습니다 게시물 번호로 접근..
어느덧 2017년이 지나가고 2018년입니다 2017년 하반기에 처음 티스토리를 시작했는데요어느덧 3~4개월 째 블로그를 꾸준히 하고 있네요 ㅎㅎ 마침 티스토리 2017 결산을 하길래 저도 해봤습니다 ㅎㅎ 먼저 제 블로그에 대한 평가네요 오.. 그런가요?? 상위 1% 부지런??왜짘ㅋㅋㅋㅋㅋ 4개월차 블로그 ㅠㅠ얼마 되지 않았습니다4년차 블로그로 성장할 때까지! 저의 대부분의 주제는 IT 인터넷입니다 ㅎㅎ맛집, 여행도 꽤나 있지만요 ㅎㅎ 저 6개 태그가 전부 IT 인터넷입니다.이렇게 보니까 글을 꽤나 많이 올렸네요..공부할 때마다 정리해서 올렸는데 ㅎㅎ 맛집도 있구요~요즘 맛집을 못가서 ㅠㅠ 그리고 요즘 가장 핫한 암호화폐(가상화폐) 정리입니다.2주? 정도 된 것 같네요 정리하기 시작한지정~말 많이 정리할..
파이썬에서 웹 크롤링을 하다보면 자동화 처리를 하고 싶을때가 있습니다 예를 들어 유튜브처럼 마우스 스크롤을 내려야 동영상 목록이 더 나오고 하는 등의 작업에서요 이럴때 크롤링을 하려면 화면 내리고 하는 작업을 할 때가 있습니다 이런걸 자동으로 할 수 없을까? 이것을 지원해주는 것이 셀레니움입니다 셀레니움은 웹 드라이버를 이용해서 접근하는데요 코드를 구성해서 실행하면 해당 웹 드라이버를 통해 웹 페이지에 접속해서 작업을 진행합니다 간단하게 설치하는 법을 알아볼까 합니다 그리고 테스트도 진행해볼게요 먼저 cmd창에서 파이썬이 설치된 경로로 이동합니다 cd 이동경로 로 이동하시면 됩니다 그리고 pip가 설치된 Scripts 폴더로 이동하세요 이후 pip install selenium을 이용해서 설치합니다 이렇..