프로그래밍을 하다 보면 자연어 처리에 관심이 가게 됩니다
자연어 처리는 인공지능(AI) 분야에서도 중요하게 생각되는 문제입니다
왜냐하면 사람이 말하는 자연어를 처리하고 인식할 줄 알아야 하기 때문입니다
예를 들어 i love you를 봤을 때 무엇이 주어이고, love라는 동사는 감정이 긍정인지, 부정인지 등을 인지해야하죠
이런 자연어 처리를 도와주는 라이브러리가 있습니다
파이썬 기준으로 NLTK라는 것이 있죠
보통 영어 단어를 인식하려고 많이 사용합니다.
(한글은 KoNLPy 라는 것을 많이 사용하죠)
이 NLTK라는 것을 설치해보고 테스트 해보겠습니다
자 먼저 파이썬이 설치된 경로로 이동합니다
보통 c드라이브에 appdata->local->programs에 설치가 되어 있을거에요
본인 PC에서 잘 찾아보세요~
그리고 pip가 있는 곳 Scripts로 이동합니다(cd 명령어 사용)
그리고 pip install nltk를 설치해줍니다
이렇게 하면 설치가 될 것입니다
이제 소스를 짜보죠
먼저 아래와 같이 nltk를 임포트하고 download 함수를 진행해야 합니다
이렇게 하면 어떻게 되냐면요
아래 사진처럼 나올거에요
여기서 왼쪽 아래에 download를 클릭해서 다운로드를 진행해줍니다
파이썬 하다가 이런건 처음이라 처음엔 좀 당황했네요
다운로드를 시작하고 있습니다~
다운로드를 클릭하면 cancel로 바뀔거에요
시간이 조금 걸립니다~
5분~10분 걸렸던 것 같아요
이제 설치가 다 되었습니다
소스를 짤 수 있어요!
아래와 같이 진행해보죠
word_tokenize 함수에 적용할 문자열을 넣습니다
저는 i love it를 넣어봤어요~
그리고 pos_tag로 해당되는 tokenize를 출력해보죠!
자 이렇게 나옵니다~
이렇게 간단하게 설치 및 테스트를 진행해봤습니다
'python' 카테고리의 다른 글
파이썬(python) 클래스, 객체지향 및 __init__ 공부해보기 (0) | 2017.11.22 |
---|---|
파이썬 문자를 아스키로, 아스키 코드를 문자로 (10) | 2017.11.21 |
립스틱 순위는 어떻게 될까? 립스틱 브랜드 분석(파이썬과 R을 이용) (2) | 2017.11.20 |
파이썬 랜덤 사용해보기! (0) | 2017.11.20 |
모바일 게임 순위를 알아보자! - 파이썬 셀레니움을 이용 (0) | 2017.11.20 |