목록데이터사이언스 (19)
꿈 많은 사람의 이야기
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dmKc7z/btsGhF82UVV/IIH7iBUgeY3DIG5LLY5rN1/img.png)
포스팅 개요 본 포스팅은 대규모 언어 모델(Large Language Model, LLM) 시대에서 데이터 사이언스(Data Science) 교육이 어떻게 변화되어야 하는지 다룬 논문 "What Should Data Science Education Do with Large Language Model?"을 리뷰하는 포스팅입니다. 워싱턴, 스탠포드, 팬실배니아, 럿거스 대학에서 공동으로 연구한 논문인데요. LLM 시대에서의 교육의 미래에 대한 연구를 진행한 논문입니다. 본 포스팅에서 리뷰한 논문은 아래 링크에서 확인하실 수 있습니다. https://arxiv.org/abs/2307.02792 What Should Data Science Education Do with Large Language Models?..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/Sf231/btsBVA6hnOZ/iSHfNNtLVD4byBaIKo6ahk/img.png)
포스팅 개요 본 포스팅은 모두의연구소에서 주최한 모두콘(moducon) 2023의 후기를 작성한 글입니다. 저는 이번 모두콘 2023에서 발표자로서도 참석을 했고 평범한 참석자로서 다양한 섹션을 들을 수 있었는데요. 이번 포스팅은 주로 발표자로서의 발표 후기를 남겨볼까합니다. 발표 자료와 전체 발표 내용은 추후 공개될 예정이라고 합니다. 공개되면 포스팅에 링크 달아두겠습니다. 모두콘 2023 https://modulabs.im/moducon2023 MODUCON 2023 지식, 경험, 마음을 공유하는 모두의연구소만의 컨퍼런스 축제 modulabs.im 포스팅 본문 이번 포스팅은 개요에서 말씀드렸듯, 모두콘 2023에서 발표자로서 발표한 후기를 작성한 포스팅입니다. 이번 모두콘 2023의 컨셉은 놀이동산(..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dfnzf1/btrUuo0SF8N/QChwAwRQ6CVYNnJvKSc9TK/img.jpg)
포스팅 개요 이번 포스팅은 2022년의 개인적인 회고 글을 작성한 포스팅입니다. 제 개인적인 회고이니만큼 '이수진'이라는 사람이 22년에 어떻게 살아왔는지 일기 느낌으로 읽어주시면 감사할 것 같습니다 :) 2022년을 마치며 정말 개인적으로 2022년은 너무너무 힘든 한 해였다. 사실 개인적인 일 때문에 힘든 것은 없었다. 다만, 책임감이 늘어났고 직장인 대학원의 졸업 시즌이라 논문을 준비하면서 굉장히 많이 힘들었던 한 해였다. 그렇게 바쁘게 지내다보니 어느덧 2022년이 지나갔다. 매번 느끼지만, 시간 정말 빠르다. 너무너무 빠르다. 그럼에도 2022년의 개인적인 회고를 한 줄로 요약하면 아래와 같이 말할 수 있을 것 같다. 2022년? 후회 없다. 해볼 수 있는 것 다 해봤고, 해보고 싶은 것 다 해..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/mqSw4/btrFJkZHN28/EfQ4WWVhKUQmFEHLu0EWR0/img.png)
포스팅 개요 이번 포스팅은 추천 시스템(recommender system, recsys) 논문 중 FDSA : Feature-level Deeper Self-Attention Network for Sequential Recommendation 이라는 논문을 리뷰라는 포스팅입니다. FDSA는 추천 시스템 방법 중 sequential recommendation 방법을 소개하며 explicit과 implicit feature-level sequence는 full sequential pattern을 추출하는데 도움을 줄 수 있다고 주장하는 논문입니다. 본 포스팅은 해당 논문의 자세한 리뷰를 정리하는 포스팅입니다. 또한, 본 포스팅은 제가 작성하고 있는 추천 시스템 시리즈 글 입니다. 추천 시스템 시리즈 논문 리..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/D9O7e/btrokrfHKEf/DeMPGaKFKvp065te9cTRkk/img.jpg)
포스팅 개요 이번 포스팅은 2021년의 개인적인 회고 글입니다. '이수진이라는 사람은 2021년에 이렇게 살아왔구나'라는 마음으로 가볍게 읽어주시면 감사하겠습니다. 2021년을 마치며 어느덧 2021년이 끝나간다. 2020년 회고를 작성한 것이 얼마 되지도 않은 것 같은데 벌써 2021년이 끝나간다. 세상 참 야속하게 시간이 빠르게 흘러간다. 2021년에도 전반적인 여러 일들이 있었다. 하지만, 그 중심에는 내 스스로의 주도적인 변화가 있었던 것 같다. 2021년 1월에 추천 시스템 연구 개발로 웅진씽크빅 회사로 이직하게 되었으며 동시에 회사와 대학원을 병행하기로 마음을 다짐하여 대학원을 다녔다. 그리고 그 대학원도 어느덧 1학년이 끝났다. 나의 2021년을 좀 더 간단하게 요약하면 4가지 카테고리와 3..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/lctPy/btrfFGtMyix/PLhhGo1A36pww748kS48S0/img.png)
포스팅 개요 이번 포스팅은 자연어처리(NLP) 논문 중 A Lite BERT for Self-supervised Learning of Language Representations라는 논문을 리뷰하는 포스팅입니다. 본 논문은 NLP논문에서 ALBERT라고 많이 알려진 논문입니다. 앞서 GPT, BERT, RoBERTa 논문 리뷰에 이어서 진행하는 자연어처리 논문 시리즈 다섯 번 째 포스팅입니다. 추가로 해당 포스팅의 내용은 제가 진행하는 사내 자연어처리 스터디에서 발표한 자료를 블로그로 정리한 자료임을 알려드립니다. 자연어처리 논문 리뷰는 아래와 같은 순서로 할 예정이며 이번 포스팅은 그 다섯 번 째 ALBERT 논문입니다. GPT-1 (https://lsjsj92.tistory.com/617) BERT ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cKhqBr/btrfo5glrKF/tGW1Q6qw9zqwADBivgPozK/img.png)
포스팅 개요 이번 포스팅은 자연어처리(NLP) 논문 중 A Robustly Optimized BERT Pretraining Approach라는 논문을 리뷰하는 포스팅입니다. 해당 자연어처리 논문은 흔히 RoBERTa라고 많이 언급되는 논문인데요. 앞서 GPT-1, GPT-2, BERT 논문 리뷰에 이어서 자연어처리 논문 시리즈 네 번째 포스팅입니다. 추가로 해당 포스팅의 내용은 제가 진행하는 사내 자연어 처리 스터디에서 발표한 자료를 블로그로 정리한 자료임을 알려드립니다. 자연어 처리 논문 리뷰는 아래와 같은 순서로 할 예정이며 이번 포스팅은 그 네 번째 RoBERTa 논문입니다. (순서는 바뀔 수 있습니다.) GPT-1 (https://lsjsj92.tistory.com/617) BERT (https:..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/MRX5s/btq9IEtZYxJ/wBl8ukyhiTKqKWq2xsrnT1/img.png)
포스팅 개요 이번 포스팅은 자연어 처리(NLP) 논문 중 GPT-2(Language Models are Unsupervised Multitask Learners) 논문에 대한 리뷰를 작성하는 포스팅입니다. 앞서 GPT-1, BERT에 이어서 자연어 처리 논문 시리즈 정리하는 세 번째 포스팅입니다. 추가로 해당 포스팅의 내용은 제가 진행하는 사내 자연어 처리 스터디에서 발표한 자료를 블로그로 정리한 자료임을 알려드립니다. 자연어 처리 논문 리뷰는 아래와 같은 순서로 할 예정이며 이번 포스팅은 그 세 번째 GPT-2 논문입니다. (순서는 바뀔 수 있습니다.) GPT-1 (https://lsjsj92.tistory.com/617) BERT (https://lsjsj92.tistory.com/618) GPT-2..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cwCTEl/btq9hOiVH9W/HTY42EbLizAIE5XWgqEluK/img.png)
포스팅 개요 이번 포스팅은 글또(글 쓰는 또라이가 세상을 바꾼다) 6기를 참여하며 어떻게 글또 6기를 활동해 나갈 것인지를 다짐하는 글입니다. 저는 지난 1년간 글또 4기, 5기를 참여했었고 이번 6기에도 참여하게 되었습니다. 지난 1년, 4기와 5기는 어떠했고 6기에는 어떻게 활동하고 싶은지 이번 포스팅을 통해 정리해보고자 합니다. 글또 : www.facebook.com/groups/geultto/ 글또 4기 때 다짐글 : lsjsj92.tistory.com/576 글또 4기 마무리 회고글 : lsjsj92.tistory.com/595 글또 5기 다짐글 : https://lsjsj92.tistory.com/603 글또 5기 회고글 : https://lsjsj92.tistory.com/614 포스팅 본문..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cXnLlw/btqLNrqvWex/HtF3nQ9CPTKmUbxcjKMO2k/img.png)
포스팅 개요 최근 머신러닝(Machine Learning)과 딥러닝(Deep Learning) 시장에 자동화 열풍이 점점 더 세게 불어오고 있습니다. AutoML은 주어진 Dataset에 맞게 Machine Learning 알고리즘을 돌려서 가장 적합한 머신러닝 모델을 찾아주는 등 점점 더 Auto와 관련된 키워드가 Data Science, AI 시장에 불러오고 있습니다. 이번 포스팅은 그 자동화 시스템 중 Exploratory Data Analysis (EDA)를 자동화해주는 라이브러리를 소개해주는 포스팅입니다. 원래 Dataset에 대해서 다양한 분석을 진행합니다. EDA는 그 중 한 방법이며 시간을 어느정도 투자해야 하는 과정입니다. 이 자동화 라이브러리는 그것을 간단하게 제공해줍니다. 그 라이브러..