목록자연어 처리 (2)
꿈 많은 사람의 이야기
이번 커널 필사편은 7주차 이후로 또 다시 자연어 처리 편입니다이 커널은 toxic 이라는 데이터로 알려져 있는데요. 캐글에서 자연어 처리(nlp) 데이터 셋으로 많이 유명합니다.일종의 분류 문제입니다. 하지만 label이 1개가 아닌 6개를 가진 특이한 데이터 구조입니다 처음 캐글을 시작할 때 타이타닉 다음으로 이 데이터 셋으로 했었는데..당시에는 아무것도 모를 때라 그냥 너무 어렵다.. 하고 포기했었는데요처음 봤을 때보다 지금이 7개월 정도 흘렀는데 이젠 좀 눈에 보이네요 ㅎㅎ 필사를 하면서 이해가 되더군요제가 그 만큼 공부를 했다는 거겠죠 ㅎㅎ 바로 진행합니다 역시 처음에 필요한 라이브러리를 가져와줍니다keras, matplotlib, seaborn, pandas, numpy 등을 가져와줍니다lay..
프로그래밍을 하다 보면 자연어 처리에 관심이 가게 됩니다 자연어 처리는 인공지능(AI) 분야에서도 중요하게 생각되는 문제입니다 왜냐하면 사람이 말하는 자연어를 처리하고 인식할 줄 알아야 하기 때문입니다 예를 들어 i love you를 봤을 때 무엇이 주어이고, love라는 동사는 감정이 긍정인지, 부정인지 등을 인지해야하죠 이런 자연어 처리를 도와주는 라이브러리가 있습니다 파이썬 기준으로 NLTK라는 것이 있죠 보통 영어 단어를 인식하려고 많이 사용합니다. (한글은 KoNLPy 라는 것을 많이 사용하죠) 이 NLTK라는 것을 설치해보고 테스트 해보겠습니다 자 먼저 파이썬이 설치된 경로로 이동합니다 보통 c드라이브에 appdata->local->programs에 설치가 되어 있을거에요 본인 PC에서 잘 찾..