목록R 프로그램 (4)
꿈 많은 사람의 이야기
지난 포스팅에 그래프 공부를 했습니다 막대 그래프, 빈도 막대 그래프 등을 공부했죠 이번 포스팅에는 선 그래프, 박스 그래프를 공부하려고 합니다 선 그래프는 시간에 따라 달라지는 그런 데이터를 표현할 때 자주 사용합니다 ggplot2의 economics 데이터를 이용해 시계열 그래프를 만들어 볼 수 있는데요 한번 진행 해보겠습니다 economics를 치면 아래처럼 나오게됩니다 date는 날짜, unemploy는 실업자 수를 말하는데요 x축에 날짜, y축에 실업자 수를 놓고 그러보죠 geom_line을 사용하면 됩니다. 선 그래프에요! 이렇게 나옵니다! 실업자 수가 줄었다, 늘어났다 하는 것을 볼 수 있습니다 다음으로는 상자 그래프가 있는데요 데이터의 분포를 직사각형으로 표현한 그래프 입니다 간단한 설명은..
유명한 통계 프로그램은 R 뿐만 아니라 SAS, SPSS 등도 있습니다 오히려 과거에는 SAS, SPSS를 더 많이 사용했죠 R에선 SAS, SPSS 등에서 사용하는 데이터를 불러올 수 있습니다. foreign 패키지를 이용하면 됩니다 install.packages를 이용해서 foreign 패키지를 설치합니다 그리고 library를 통해 패키지를 부착합니다 SPSS 기준으로 설명해드리면 아래와 같이 사용가능해요 read.spss(file = "파일명", to.data.frame = T)를 합니다. to.data.frame은 spss 데이터를 R 데이터 프레림 형태로 변환하는 옵션입니다 위 처럼 사용하면 데이터 프레임 형식으로 들어가게 됩니다
R 에서 분석한 그래프를 이미지로 저장할 수 있는 방법이 있습니다 R 스튜디오(studio)를 기준으로 설명할게요 그래프가 나오는 plots 탭에 Exports가 있을겁니다 저길 클릭하면 아래 처럼 나오게 됩니다 그리고 이미지 또는 pdf 파일로 저장하시면 됩니다 정말 간단하네요!
R에서 데이터를 다룰 때 데이터를 합쳐야 할 상황이 생길 수 있습니다 당연히 이런 기능이 존재합니다 행으로 합치거나 열로 합치거나 둘다 가능합니다. left_join함수와 bind_rows를 이용하면 됩니다. 아래 사진 처럼 합칠 수 있어요~ 위는 열을 합치는겁니다. 아래는 행 데이터를 합치고요~ 이제 실습을 해보겠습니다. 먼저 열을 합치는 경우에요~ data1, data2를 생성하겠습니다. 각각 id 변수는 동일하지만 midterm과 final이 다릅니다 위 사진 처럼 데이터 프레임을 만들어줍니다 각각을 출력하면 아래처럼 나오게 되겠죠? 먼저 left_join을 이용해서 열을 합쳐보겠습니다. by="id"를 통해 공통 변수인 id로 맞추어서 합치겠습니다~ 합친 데이터를 total에 넣고 출력해보죠 위 ..