해당 글은 (lsjsj92.tistory.com/612)
에서 내용을 추가하여 업데이트 하였습니다!
자연어 처리를 하다보면 자연스레 형태소 분석기를 많이 사용합니다.
저는 본래 mecab(은전한닢) 형태소 분석기를 많이 사용하는데요
사용자 사전도 구축할 수 있고 꽤나 정확도가 좋기 떄문입니다.
하지만 은전한닢은 윈도우에서 사용할 수 없는 단점이 있습니다.
그래서 윈도우에서 형태소 분석기를 사용하려면 konlpy를 자연스레 사용해야합니다.
이번 포스팅은 konlpy를 설치하는 방법에 대해서 알아봅니다.
1. 먼저 java(자바)가 1.7버전 이상 설치되어 있어야 합니다.
자바를 설치하는 과정은 써놓지 않겠습니다.
2. 제 환경은 파이썬 버전 3.6입니다. 윈도우 64비트 환경이고 윈도우10을 사용합니다.
위 사이트로 가셔서 본인 환경에 맞는 Jpype1 whl을 받으셔야합니다.
저는 앞서 말씀드린대로 파이썬 3.6을 사용하고 윈도우 64비트 이기 때문에 체크 표시를 한 부분을 받았습니다
그리고 해당 파일을 받고 pip가 설치된 위치로 옮겨줍니다!
19년 2월 26일 기준 0.6.3 버전이네요
pip install JPype1-0.6.3-cp36-cp36m-win_amd64.whl
을 통해서 pip install을 통해 jpype1를 설치해줍니다
잘 설치가 되면 success가 나옵니다
그리고 나서 잊 pip install konlpy로 konlpy를 설치해주면 됩니다.
그리고 잘 동작되는지 직접 텍스트를 작성합니다.
konlpy는 komoran(코모란), Kkma(꼬꼬마), 트위터(twitter, okt) 이제 트위터는 okt로 바뀌었다고 하는군요
이런 다양한 형태소 분석기 들이 있습니다.
from konlpy.tag import 원하는형태소분석기
를 통해 불러오셔서 사용하시면 됩니다
'python' 카테고리의 다른 글
tensorflow의 tf.concat에 대해서 알아보기(axis = 0, 1에 따른 변화) (0) | 2019.03.18 |
---|---|
자카드 유사도, 코사인 유사도, 맨하탄 유사도(Manhattan), 유클리디안 유사도를 알아보자 (2) | 2019.02.27 |
파이썬(python)으로 SNS 텍스트 데이터 분석하기(python word2vec, python 크롤링) (4) | 2019.02.25 |
파이썬으로 업무 자동화하자! 데이터 흐름도(data flow chart) 만들기 (6) | 2019.02.25 |
웹 div를 image로 download하는 방법!(html2canvas.js) (2) | 2019.01.31 |