세로형
Recent Posts
Recent Comments
Link
04-25 01:17
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Archives
Today
Total
관리 메뉴

꿈 많은 사람의 이야기

텐서플로와 머신러닝으로 시작하는 자연어 처리 책을 공부한 후기! 본문

텐서플로와 머신러닝으로 시작하는 자연어 처리 책을 공부한 후기!

이수진의 블로그 2019. 3. 14. 14:18


본인은 딥러닝에 관심이 많다. 뭐 이론은 잘 모르지만 코드를 작성하고 뭔가 내 아이디어를 딥러닝에 접목시키고

그리고 만들어내는 것이 너무 재밌기 때문

그 중에서도 자연어 처리가 정말 재밌다.

영상 처리는.. 개인 PC로는 너무 무리가 있다. 데이터도 그렇고 메모리 측면에서도 그렇고 ㅠㅠ


그러다가 일이 바빠서 한 동안 딥러닝을 못했었다.

그리고 최근 회사가 안좋은 일이 생겨 어쩔 수 없이 강제로 쉬게 되었는데 마침 예약 주문한 책이 왔다


'텐서플로와 머신러닝으로 시작하는 자연어 처리'

로지스틱 회귀부터 트랜스포머 챗봇까지

전창욱, 최태균, 조중현님이 지으셨다.


전창욱님은 모두의 연구소에서 강연하는 것 한 번 봤었는데

정말 잘하시더라.. 뭐 아무튼


나는 자연어 처리를 공부를 하다가 어느샌가 LSTM까지 공부하고 막혔었다.

흔히 seq2seq라고 불리우는 sequnce-to-sequnece 시퀀스 모델과 transformer(트랜스포머)

어텐션(attention) 기법 등은 너무 어려웠다.


그러는 와중에 갑자기 BERT라는 애가 나오고.. 얘는 더더욱 모르겠고

약간 슬럼프 아닌 슬럼프에 빠져있을 때 나왔던 책이다


아직 발행도 안됬는데 바로 사전예약으로 질렀다

그리고 2주정도 봐서 어제 책을 한 바퀴 봤다




이렇게 생긴 책이다

위키북스에서 나왔고 데이터 사이언스 시리즈로 나왔다


목차는 기본적인 배경과 개발 준비

분류(classification), 텍스트 유사도(text similarity), 챗봇(chatbot)으로 되어 있다

부록과 앞의 목차 부분 제외하면 실 페이지는 대략 330페이지 정도? 되는 것 같다



실제 내가 공부한 것

거의 맨 처음이다

저렇게 중간중간 그림도 나와있고 

무엇보다 설명이 너무 깔끔하다

그래서 정말 좋았다.


이미 기반 지식이 그래도 0.01%라도 있어서 그런가 초반에는 이해하기 어렵지 않았다



필요한 부분은 수식도 나와있다

그리 어렵지 않은 수식이다

사실 수식은 뒤에 가면 없다

수식 무서우신 분들은 두려워하지 않으셔도 된다

(나도 그랬다 ㅎㅎㅎ)



그리고 이렇게 코드를 보여주고 설명하는 식으로 책이 진행이 된다

그래서 이해하기도 쉽고 따라가기 쉽다

코드를 하나하나 쳐보면서 설명도 보고 그러면서 진행할 수 있어서

지겹지도 않고 금방금방 할 수 있다는게 큰 장점이다



그리고 안의 데이터 같은 것들이 캐글(kaggle)에서 제공되는 데이터이고

이 책에서도 그 주제로 진행하는 것이 있기 때문에 캐글도 하면서 이 책도 공부할 수 있다는 것이 좋다


평점은 5점중에 4.5점이다

너무 좋은 책이다.


하지만 초보자들에게는 쉽지 않을 것이다.

왜냐하면 인공지능이나 딥러닝, 머신러닝에 대한 기반적 지식은 설명이 없다고 보면 된다

적어도 조금은 공부가 되어 있어야 코드가 눈에 보이고 설명도 이해가 될 것이다


다만 좀 아쉬운 점이 있다면

1. 오타가 조금 있었다 ㅎㅎ 그래서 창욱님께 페이스북으로 메시지를 드려서 피드백을 드렸었다.

(잘한 것인지는 모르겠지만)

2. 설명이 간결하다보니 부족한 부분이 조금 있다. 그래서 본인은 구글링이나 이런걸로 다시 찾아보고 공부하고 그랬다


하지만 진짜 국내 자연어 처리 책 중에서 이만한 책은 현재 없다고 생각된다

정말정말 잘 나온 책이다!


텐서플로와 머신러닝으로 시작하는 자연어 처리! 자연어 처리에 관심이 많으신 분들은 보시면 좋을 듯 하다



반응형
그리드형
Comments