목록분류 전체보기 (572)
꿈 많은 사람의 이야기
xgboost는 앙상블(ensemble) 부스팅(boosting)에서 많이 사용하는 알고리즘 중 하나입니다. 이 xgboost는 파이썬 사이킷런(python scikit learn)에서 그냥 제공되지는 않는데요. 즉, 따로 설치를 해주어야 합니다. 사이킷런을 설치했다고해서 xgboost가 install되어 있지 않습니다. 그래서 xgboost를 따로 설치해주어야 합니다. 이번 포스팅은 윈도우 10 환경에서 앙상블 xgboost(ensemble xgboost)를 설치해보는 포스팅입니다. 1. 파이썬 아나콘다를 이용한 xgboost 설치 (python anaconda3 xgboost install) 이 방법은 굉장히 간단합니다. anaconda3가 제공해주는 강력한 패키징 기능으로 xgboost를 간단하게 ..
최근 머신러닝 기초반 스터디를 진행하면서 느끼는 점이 있습니다. 또한, 이메일로 질문 받는 것중 적지 않는 질문이기도 합니다. 그 질문은 아래와 같습니다. 왜 머신러닝(machine learning), 딥러닝(deep learning)에서는 데이터를 나누나요? 도대체 X, y는 뭐고 feature는 뭐죠? X_train, X_test, y_train, y_test는 뭐죠? 정말 원초적인 질문이지만, 당연히 궁금해 할 질문입니다. data science가 이제 인기를 끌면서 많은 분들이 Python을 배우시고 Python을 활용한 데이터 분석과 머신러닝, 딥러닝을 하고 있습니다. 하지만, 너무 급하게 너무 빠르게 배우느라 기본적인 것들을 놓치는 것 같습니다. 그래서 이러한 질문이 계속 오기 때문에 머신러닝..
이전 포스팅에서 머신러닝의 앙상블 그 중 부스팅(ensemble boosting)에 대해서 포스팅을 했었습니다. https://lsjsj92.tistory.com/543 머신러닝 앙상블 부스팅이란? - ensemble boosting 머신러닝에서는 앙상블(ensemble)을 정말 많이 사용합니다. 그 효과가 매우매우 강력하기 때문인데요. 이 앙상블에는 배깅(bagging), 부스팅(boosting) 등의 종류가 나뉘어져 있습니다. 지난 포스팅 때는 ensemble.. lsjsj92.tistory.com 이번 글은 앙상블 부스팅(ensemble boosting) 중 Adaboost와 Gradient Boosting에 대해서 알아보려고 합니다. ensemble boosting - Adaboost Adaboo..
머신러닝에서는 앙상블(ensemble)을 정말 많이 사용합니다. 그 효과가 매우매우 강력하기 때문인데요. 이 앙상블에는 배깅(bagging), 부스팅(boosting) 등의 종류가 나뉘어져 있습니다. 지난 포스팅 때는 ensemble bagging에 대해서 설명했었고 random forest에 대해서도 설명했습니다. https://lsjsj92.tistory.com/542 머신러닝 bagging 앙상블 랜덤 포레스트(random forest)란? 머신러닝 앙상블에는 배깅(bagging), 보팅(voting), 부스팅(boosting)이 있습니다. 그 중 앙상블 bagging에 속한 랜덤 포레스트를 이번 포스팅에서 소개할까합니다. 이 random forest는 빠른 속도와 높은 예측 성.. lsjsj92...
머신러닝 앙상블에는 배깅(bagging), 보팅(voting), 부스팅(boosting)이 있습니다. 그 중 앙상블 bagging에 속한 랜덤 포레스트를 이번 포스팅에서 소개할까합니다. 이 random forest는 빠른 속도와 높은 예측 성능을 보이는 알고리즘입니다. 본문에 나와있는 코드는 아래 github에서 확인할 수 있습니다 github.com/lsjsj92/machine_learning_basic lsjsj92/machine_learning_basic Repo for everyone who wants a machine learning basic - lsjsj92/machine_learning_basic github.com 랜덤 포레스트(random forest)란? 랜덤 포레스트(random f..
저는 현재 머신러닝, 데이터 분석 관련 스터디를 진행하고 있습니다. 스터디를 진행하면서 계속 발생했던 이슈가 jupyter-notebook 실습 환경 이슈였는데요. 어떻게 하면 뒤에 앉으신 분들까지 주피터노트북이 잘 보일까 고민하다가 주피터 노트북을 ppt로 만들 수 있는 방법에 대해 알게 되어 글을 작성합니다. (사실.. 스터디 환경에선 크게 도움이 되지는 않았지만 아직 제가 사용법에 미숙해서 그런 것 같습니다.) 바로 Python에서 제공해주는 RISE라는 패키지를 사용하면 됩니다. 이거를 설치하면 jupyter-notebook에서 ppt와 같이 운영할 수 있습니다. 먼저 아나콘다에서 rise와 관련된 패키지를 설치해주어야 합니다. conda install -c conda-forge rise를 통해 ..
최근 머신러닝, 딥러닝 등의 데이터를 활용한 기술적 요구, 서비스적 요구가 증가하고 있습니다. 단순히 기존에 웹 서비스, 앱 서비스를 제공해주는 것을 넘어서 사용자 데이터를 수집하는 방법, 저장하는 방법, 처리하는 방법에 대해서도 꾸준히 이야기가 나오고 있죠. 저는 최근에 저 중에서도 '머신러닝 프로젝트는 어떻게 관리되고, 어떻게 운용이 될까?'에 대해 정말 많이 궁금했었습니다. 이러한 프로젝트는 비교적 최근에 발생하고 있어서 어떤 것이 체계적인지 알 수 있는 방법이 많이 없었습니다. 예를 들어 웹 개발 같은 경우에는 Man Month 등을 계산해서 비용 계산하고, WBS나 간트 차트 등을 이용한 일정 관리 이후에 기획이 나오고 기획에 따른 개발 진행 등등 이런 프로세스가 있는 것으로 경험을 했는데(저의..
이번 포스팅은 아나콘다3를 활용해서 파이썬3.6(python3.6)을 설치해보도록 하겠습니다. 요즘 프로그래밍 언어 중 파이썬이 당연 핫합니다. 주로 data science 분야에서 매우 핫하다보니 그런데요 그러다보니 머신러닝, 딥러닝 기술로 인한 파이썬 수요가 굉장히 많습니다. 그래서 이번 포스팅은 최근 아나콘다 버전을 기준으로 파이썬 3.6 버전을 설치해보려고 합니다. 최근 anaconda3를 설치하면 python3.7 기준으로 받아집니다. 하지만, 아직 3.7이 여기저기서 버전 충돌이 일어난다고 들려오고 있어서 3.6으로 설치해보는 방법으로 소개해볼까합니다. 그럼 시작합니다 아나콘다(Anaconda)란? 아나콘다는(뱀 이름 아닙니다..) 파이썬에서 수학, 과학 분야에서 사용되는 여러 패키지들을 한 ..
아마 개발자 분들은 하루종일 컴퓨터 앞에 앉아 있어서 IDE 툴들의 색상을 어둡게 하시는 분들이 많을겁니다. 하얀색 화면은 눈이 너무 아프거든요 (저만 그런가요..) 특히 파이썬은 IDE 툴로 pycharm(파이참)을 많이 사용하는데 파이참은 설치할 때 theme를 어둡데 설정할 수 있어서 어두운 배경색을 가지고 개발을 할 수 있습니다. 그러나 파이썬 특성상 jupyter notebook 즉, 주피터 노트북으로도 개발을 많이 사용하는데요. 이게 기본이 하얀색입니다. 아래 사진처럼요 하양하양하죠 이게 이쁘긴하지만 화면을 오래보고 있으면 눈이 아픕니다. 안에 들어가서도 마찬가지구요 그래서 이 주피터 노트북의 색상, 테마를 변경하는 방법에 대해 포스팅할까합니다. jupyter의 테마를 바꾸는 것은 정말 간단합..
얼마전 도커를 이용하다가 아래와 같은 에러를 발견했습니다. In the default daemon configuration on Windows, the docker client must be run elevated to connect. This error may also indicate that the docker daemon is not running. Error response from daemon: Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) 라는 에러였습니다. 이 에러는 도커 이미지를 다운..