목록IT (205)
꿈 많은 사람의 이야기
지난 시간에 KoNLP를 이용해서 텍스트 마이닝을 진행했습니다 이번 포스팅은 지난 시간에 진행한 텍스트 마이닝으로 워드클라우드(word cloud)를 진행해볼게요 워드 클라우드는 많이 익숙한 자료입니다 단어들이 마치 그림처럼 색깔별로, 빈도수 별로 크기도 다르게 나오죠 지난 포스팅 자료는 아래와 같습니다 http://lsjsj92.tistory.com/216 자 이제 워드클라우드에 필요한 패키지를 설치하죠 install.packages()를 통해 wordcloud를 설치합니다 wordcloud를 설치하면 자동적으로 RColorBrewer도 설치됩니다 글자 색깔을 표현하기 위해서요 이제 색깔먼저 입힐게요 pal이라는 변수에 brewer.pal()을 이용해서 색깔을 입힙니다. Dark2 계열에 색깔을 입힐게..
R에서 텍스트 마이닝을 할 수 있습니다 즉 텍스트(문장)이 주어지면 그게 주어인지, 동사인지 등등을 파악할 수 있죠(형태소 분석) 저는 영어가 아닌 한글의 텍스트 마이닝을 진행해보려고 합니다. 일단 이 텍스트 마이닝을 진행하려면 컴퓨터에 java가 설치되어 있어야 합니다 자바가 설치되어 있다고 가정하에 진행하겠습니다 위 3개의 패키지를 설치해줍니다 KoNLP, rJava, memoise 3개의 패키지입니다 패키지 설치가 완료되었죠? 자 이제 useNIADic( )을 통해 사전을 가지고 옵니다 KoNLP에서 지원하는 NIA 사전은 98만여 개의 단어로 구성되어 있는데요 이 사전을 활용해서 진행해야 합니다 저렇게 useNIADic( )을 하게 되면요 이렇게 install이 되면서 진행될겁니다 98만여개의 단..
R에서 만든 그래프를 웹 페이지에 올리고 싶을때가 있습니다 캡쳐나 이미지 파일로 저장을 해서 img파일을 올릴 수도 있습니다 하지만 인터렉티브 그래프(마우스에 따라서 값을 보여주고 하는 등의 움직임이 있는 그래프)는 이미지로 보여줄 수 없습니다 말 그대로 그래프 자체가 html로 만들어져야 하기 때문이죠 이럴때 R에서 그래프를 html로 만들 수 있습니다! 방법은 정말 간단해요~ R 오른쪽 밑에를 보면 Viewer탭 아래에 Export가 있습니다. 여기를 클릭하면 Save as Web Page라고 나오는데요 저걸 누르시면 됩니다 만약 무슨 알림창이 나오게 되면 확인을 누르시면 되어요! 저는 test라는 이름으로 만들었습니다 ㅎㅎ html파일이 생성되었죠? 웹페이지에 올려볼까요? 잘 나오네요! 이런식으로 ..
R에서 분석을 하다보면 축을 변경하고 싶을때가 있다 예를 들어 원래 x축에 있는 값인데 얘가 값이 많아서 겹치는 일이 발생해 이름이 안보일 수도 있습니다 그러면 x축 기준 값을 y축으로 이동하고 y축 기준 값을 x축으로 이동해서 보면 편하겠죠? 이럴때 R에선 coord_filp이라는 것을 쓰면 됩니다 먼저 이렇게 해볼게요 x축은 종교, y축은 인원수라고 가정하고 만들어보겠습니다 그러면 위와 같이 그래프가 그려질겁니다 근데 저 x축을 y축으로 이동하고 싶으면? coord_filp( )을 추가하면 됩니다 자 이렇게요! coord_flip만 추가해주면요 이렇게 축 회전이 됩니다~
통계 분석을 하다보면 값을 오름차순이나 내림차순이나 변경해야 할 때가 있습니다 그럴때 쓰는 방법이 있죠 어떤 형식이냐에 따라 다릅니다 그래프 형식에서는 reorder라는 것을 쓸 수 있구요 그냥 일반 벡터에는 sort의 decreasing을 사용하면 됩니다. 먼저 ggplot 그래프에서 오름차순, 내림차순으로 해보죠 이렇게 하면 그래프가 아래처럼 나옵니다 내림차순으로 나오죠 얘를 그럼 오름차순으로 해보죠 reorder를 이용합니다 자 어떻게 되나 볼까요? 이렇게 바뀌게 됩니다! 그래프에선 이렇게 바꿀 수 있고요 다음은 그냥 일반 벡터에서 볼까요? a에 1부터 50까지의 숫자를 랜덤하게 넣습니다 이렇게 넣으면요~ 위 처럼 될 것입니다 1부터 50까지 숫자가 랜덤으로 들어가있죠? 이걸 이제 정렬해볼게요! s..
Django에서 app이라는 것이 있습니다. 이 앱은 파이썬에서 사용하는 파이썬 패키지입니다. 장고 앱 패키지는 모델(model), 뷰(view), 템플릿(template) 등을 독자적으로 가지고 있습니다 일반적으로 하나의 django(장고) 프로젝트는 하나 이상의 장고 앱으로 구성되어 있다고 하네요~ 규모가 클 수록 이런 앱들을 모듈화(module)하여서 관리한다고 합니다 그리고 가장 중요한 것은 장고는 MTV패턴을 따릅니다. jsp나 기타 웹 애플리케이션에선 MVC패턴을 따르죠. MVC는 모델, 뷰, 컨트롤러 이 3가지의 형태로 웹이 동작되는 패턴입니다. 뷰는 말 그대로 사용자에게 보여지는 뷰이고요 모델은 bean이라고도 불리죠. 일종의 데이터 틀입니다. 컨트롤러는 모델과 뷰를 이어주는 일종의 중간자..
파이썬에서 웹 애플리케이션 프레임워크가 존재하는데요 그게 바로 Django입니다. 이 프레임워크 자체가 파이썬으로 개발되어 있어서 많은 파이썬 사용자들이 사용하죠 쉽고 빠르게 웹사이트를 개발할 수 있기 때문입니다 여기서는 윈도우10 기준으로 설명합니다~ 먼저 설치를 해보죠 파이썬이 설치되어 있다고 가정하에 진행합니다. 먼저 파이썬이 설치된 경로로 이동합니다. 보통 c드라이브 -> 유저 -> 본인 유저 -> appdata -> local ~~ 밑에 있습니다 거기서 pip가 있는 Scripts폴더에 들어갑니다 그리고 pip install django를 입력하세요! 그럼 쭉쭉 설치가 될 것입니다~ 그런 다음 c 드라이브에 있는 python 폴더를 만들고 들어갑니다 저는 거기다가 jango라는 폴더를 하나 더 ..
파이썬에서는 모듈을 다룰 수 있습니다 본인이 직접 만들 수도 있구요, 다른 사람이 만든 것을 가지고 올 수도 있습니다 import라는 것을 써서 말이죠 모듈로 관리하게 되면 기능을 나누어서 관리할 수 있습니다 그래서 관리도 용이하고 사용하기도 편하죠 만약 내가 현재 A 라는 기능을 쓰고 있는데 '아 언젠가는 다시 쓸 것 같은데?' 라고 생각해서 파일을 만들었습니다 그리고 B라는 작업을 하는데 이때 A라는 작업이 필요하게 되었어요 근데 B라는 파일에 다시 A의 기능을 코딩을 한다? 물론 해도 좋지만 귀찮고, 시간 낭비에 좀 비효율적이죠 A라는 파일이 이미 있는데 굳이 만들 필요가 없죠 이럴때 import를 이용해서 모듈을 가지고 옵니다 저는 이 모듈 실습을 위해 총 4개의 파일을 준비했어요 빨간색 선을 기..
클래스는 가장 익숙한 언어가 (저 기준으로) 자바입니다 자바는 객체지향 언어의 대표주자로 클래스를 이용해 객체를 생성하고 그것을 이용해서 프로그램을 구성하죠 파이썬도 마찬가지로 클래스가 있습니다. 또한, 마찬가지로 객체지향도 되구요 객체지향이라는 것은 프로그래밍이 익숙치 않으신 분들은 이해하기 힘드실 겁니다 그냥 제가 이해한 간단 설명은 이런거에요 화장품을 예를 들어 설명해보죠 스킨 로션을 생성하는 공장 A가 있습니다. 이 A에서 스킨 로션을 계속 생성해줘요 근데 생성하는 스킨 로션이 100% 일치할 수 없습니다 예를 들어 용량이나, 성분이나 브랜드 100% 일치한다고 볼 수 없죠(이니스프리 스킨로션, 더 페이스 샾 스킨 로션 등등요) 이렇게 공장 A가 생성하는 스킨 로션이 바로 객체입니다 그리고 그 객..