목록전체 글 (572)
꿈 많은 사람의 이야기
깃허브를 운영하면서 add를 통해 파일을 등록하고 commit으로 로컬에 저장을 하는데 이때 파일명을 변경하거나 삭제를 하면 다르게 처리를 해줘야합니다. 물론 깃허브와 연동된 디렉토리에서 git add . 를 하게 되면 전부 반영이 되서 상관은 없지만 특정 파일, 특정 디렉토리 등만 반영하고 싶으면 이야기가 조금 달라집니다. 어떤 의미냐면 아래와 같은 상황이 발생됩니다. 만약 제가 로컬에서 011. regression.ipynb 이라는 파일을 011. regression - basic, linear regression.ipynb로 변경을 하면 이미 로컬에는 011. regression.ipynb라는 파일은 없겠죠? 대신 011. regression - basic, linear regression.ipyn..
이전 포스팅에서 형태소 분석기 중 하나인 은전한닢(mecab)을 설치를 해보았습니다. https://lsjsj92.tistory.com/491 형태소 분석기 MeCab! 은전한닢을 설치하고 파이썬과 연동하기! 요즘 자연어처리 (NLP)가 정말 핫합니다 텍스트 데이터를 활용하면 다양한 가치를 찾을 수 있고 재미있는 분석이 가능하기 때문이죠 그러나 우리나라 텍스트 데이터 분석은 형태소 분석기가 많이 필요합니다 영어.. lsjsj92.tistory.com 하지만 형태소 분석기를 하다보면 형태소 분석이 되지 않는 단어들이 있습니다. 이런 단어들은 형태소 분석기의 큰 단점이라고 볼 수 있죠 하지만 은전한닢 mecab에서는 사용자 단어 사전(user word dictionary)을 구축해서 형태소 분석이 되지 않는..
이번 포스팅은 기술적 포스팅이 아니라 컨퍼런스에 갔다온 후기를 작성합니다. 본인은 현재 에듀테크(edutech)에 종사하고 있습니다. 교육에 IT 기술을 접목시킨 분야인데요. 해당 분야에서 data science 팀에서 활동하고 있습니다. 그러다보니 자연스럽게 edutech에 대해서 관심을 많이 가지고 있고 조사를 계속 하고 있습니다. 그리고 마침 이번에 삼성역에 있는 코엑스에서 e-learning korea 2019 edutech fair가 열리는 것을 알게 되었습니다. edutech에 대한 기술동향과 어떤 이슈가 있는지 알아보기 위해서 해당 컨퍼런스에 참석해서 갔다왔습니다. 후기 시작합니다! 코엑스 C2몰에서 진행되고 있었습니다. 간판으로 크게 e-learning korea 2019 edutech f..
지난 포스팅까지 django rest api framework를 활용해서 rest api를 연동하고, update, delete, list view를 진행했었습니다. 이번 포스팅이 django rest api 시리즈 마지막편 4편입니다. 마지막은 이제 CRUD에서 하지 않았던 Create 부분을 하겠습니다. 역시 먼저 serializers.py를 설정해줘야겠죠! serializers.ModelSerializer를 상속해줘서 create serializer를 만들어줍니다. 이제 views.py로 넘어갑니다. views.py에서는 당연히 방금 만든 serializer를 import 해야겠죠? 그리고 rest_framework.generic에 있는 CreateAPIView를 import해줍니다. 이게 바로 c..
안녕하세요. 파이썬 장고를 활용한 게시판 웹 개발 14편입니다. 지난 포스팅까지 진행하면서 django rest api의 read 부분을 공부해봤습니다. rest api에는 CRUD가 있는데요. 현재 여기서 Read 부분만 한 것이죠? 그럼 django rest api에서 Update, Delete는 어떻게 할까요? 이번 포스팅은 update와 delete에 대해서 알아봅니다. 먼저 django rest api를 위해 만들었던 프로젝트에 들어갑니다. 여기에 보시면 UpdateAPIView와 DestroyAPIView를 상속했죠? 마찬가지로 rest_framework.generics 아래에 있습니다. 그리고 delete와 update에 해당되는 url도 추가해주셔야합니다. detail때와 마찬가지로 (?P..
가끔 웹 크롤러를 개발하다 보면 이런 상황이 있습니다. 윈도우에서 web crawler를 개발하면 당연히 화면이 있죠? 여기서 화면이라는 것은 window가 있다는 것입니다. 즉, 크롬 브라우저를 띄울 수 있고 그걸 볼 수 있습니다. 이러한 환경은 ubuntu나 centos에서도 마찬가지입니다. 하지만, 모든 환경이 다 이렇지 않습니다. linux 계열의 서버를 사용할 때 이런 window 개념이 없을 수도 있습니다. 말 그대로 kernel 상태만 주어지고 display가 없는 상태이죠 그럼 이 display가 없는 상태에서 python seleinum으로 웹 크롤러를 어떻게 개발할까요? selenium은 web browser를 화면에 띄우고 거기서 html 데이터를 가지고 옵니다. 근데 이 displa..
완성된 코드는 아래 github 주소에 있습니다! 도움이 되셨다면 좋아요와 깃허브 스타를 눌러주세요! 저에게 있어 큰 힘이 됩니다 ㅠㅠhttps://github.com/lsjsj92/django_todo_app 지난번 포스팅에서 django와 REST API를 연동해서 개발을 진행해봤습니다. 생각보다 어렵지 않은 작업이었죠? 이제 이 작업을 기반으로 detail view를 만들어봅니다. 지난번 포스팅이 list view였다고 생각하시면 됩니다. 하지만 이번 과정에서 조금 수정을 해주겠습니다. 만약, REST API를 활용해 웹 개발을 하시면 이것은 기존에 웹 게시판을 개발한 것과는 다릅니다. 기존 게시판은 단순히 웹과 DB가 연동해서 진행되었지만 이제는 REST API 서버가 DB를 바라보고 웹은 RES..
파이썬 개발을 하다 보면 pandas dataframe을 자주 사용합니다. 정말 너무 편리하기 때문입니다. mysql, mariadb와 같은 RDBMS에서 데이터를 가지고 올 때도 dataframe을 많이 사용하고 csv 파일 등을 읽을 때도 많이 사용하죠 특히 뭐 기타 언어들도 많이 사용하는 key, value 자료구조형인 파이썬에선 dict 구조도 많이 사용합니다 그리고 이 dict 구조를 dataframe으로도 많이 변환하죠 그래서 이번 포스팅은 그 방법에 대해서 알아보고 ValueError: DataFrame constructor not properly called! 에러에 대해서도 알아봅니다. 예를 들어 위와 같은 데이터가 있다고 해보죠 위와 같은 데이터 구조는 dict의 그냥 전형적인 구조입니..
완성된 코드는 아래 github 주소에 있습니다! 도움이 되셨다면 좋아요와 깃허브 스타를 눌러주세요! 저에게 있어 큰 힘이 됩니다 ㅠㅠhttps://github.com/lsjsj92/django_todo_app 파이썬 장고(django)로 웹 개발하는 시리즈를 오랜만에 올립니다. 이미 내용은 다 있지만 블로그에 올릴 시간이 없었네요 ㅎㅎ 지난번 내용은 장고와 Ajax를 연동시켜서 웹 개발을 하는 것까지 진행했습니다. (https://lsjsj92.tistory.com/490) 이번 포스팅부터는 django와 REST API를 연동하는 작업을 진행하려고 합니다. REST API는 굉장히 많이 들어보셨을겁니다. RESTful API 라고도 하죠. REST API는 HTTP의 기능도 지원해줘서 HTTP의 장점..
지난 포스팅에 seq2seq 모델을 적용시켜서 기계 번역에 대해서 알아보았습니다. 인공지능 기반 자연어 처리 번역 즉, 기계 번역(NMT)은 규칙 기반부터 확률, 통계 기반으로 시작하여 현재 딥러닝을 활용해 기계 번역을 하는 역사를 가지고 있다는 것도 배웠죠 또한, 그 중심에 seq2seq 모델이 있다는 것도 배웠습니다. 하지만 seq2seq는 한계가 있습니다. 그 한계는 바로 번역이 잘 되지 않는다는 것이죠 그래서 어텐션 메커니즘이 나오게 됩니다. Attention Mechanism은 무언가에 집중한다는 개념입니다. 이 어텐션 메커니즘의 효과는 정말 어마어마합니다. 현재 자연어처리 분야에 있어서 어텐션 메커니즘을 안쓰는 곳이 없기 때문이죠. 또한 인공지능, 딥러닝 분야에서도 핫한 기술이기도 합니다. 이..