목록버전관리 (4)
꿈 많은 사람의 이야기
포스팅 개요 이번 포스팅은 데이터와 머신러닝 모델(Machine Learning model)의 버전을 관리할 수 있는 Data Version Control(DVC)에 대해 작성합니다. Machine Learning 프로젝트(혹은 Deep Learning)을 하다보면 ML 모델의 버전 관리, 데이터 버전 관리에 대해서 생각을 하게 되는데요. 그것을 지원해주는 것이 Data Version Control(DVC) 입니다. 저도 회사 선배님께 DVC 키워드를 얼마전 듣게 되었고 바로 간단하게 학습을 해보았습니다. 이번 포스팅에서 사용하려는 DVC는 https://dvc.org/ 입니다. 이 DVC는 open source이고 github에도 자료가 있습니다.참고한 자료는 아래와 같습니다. https://dvc.o..
포스팅 목적 이번 포스팅은 .gitignore에 대해서 작성합니다. git을 하다보면 .gitignore가 많이 보이는데요. 이 gitignore을 왜 사용하는지, 사용하는 목적이 무엇인지 그리고 사용하는 방법에 대해서 작성합니다. 포스팅 본문 gitignore를 왜 사용하는가? gitignore 사용하는 이유에 대해서 먼저 .gitignore를 왜 사용하는지에 대해서 정리합니다. 다양한 이유로 github, gitlab 등을 이용할 때 .gitignore을 사용하는데요. 그 이유들은 아래와 같습니다. 파일 백업 정보, 제품 빌드 정보 등의 로컬 구성 재정의 등을 저장소에 올려놓지 않기 위함 이런 파일들을 untracked files로 설정하여 git이 이 파일들을 track하지 않도록 함 각종 nois..
깃허브를 운영하면서 add를 통해 파일을 등록하고 commit으로 로컬에 저장을 하는데 이때 파일명을 변경하거나 삭제를 하면 다르게 처리를 해줘야합니다. 물론 깃허브와 연동된 디렉토리에서 git add . 를 하게 되면 전부 반영이 되서 상관은 없지만 특정 파일, 특정 디렉토리 등만 반영하고 싶으면 이야기가 조금 달라집니다. 어떤 의미냐면 아래와 같은 상황이 발생됩니다. 만약 제가 로컬에서 011. regression.ipynb 이라는 파일을 011. regression - basic, linear regression.ipynb로 변경을 하면 이미 로컬에는 011. regression.ipynb라는 파일은 없겠죠? 대신 011. regression - basic, linear regression.ipyn..
개발하는 사람들은 거의 필수적으로 깃을 이용합니다깃(git)은 오픈소스로서 일종의 버전관리에 매우 최적화된 것인데요 이것을 이용해 웹 상에서 서비스를 제공해주는 깃허브너무 많이 사용하고 있습니다. 이 깃허브(github)와 파이참(pycharm)을 연동하는 방법을 설명해볼까합니다. 먼저 https://github.com으로 이동하셔서회원가입을 해줍니다!그리고 repository(저장소)를 하나 생성하죠 저는 주로 keras를 사용해서repository 이름을 keras로 하나 생성했습니다. 이것은 그냥 테스트를 위해서 이렇게 올린거구요원래는 좀 명확하게 이름을 지어주셔야 합니다.아무튼 이제 파이참으로 넘어가서 연동해보죠 파이참의 VCS -> Github가 있을겁니다.Github가 없으면 Git으로 해도 ..