세로형
Recent Posts
Recent Comments
Link
11-25 00:03
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
Archives
Today
Total
관리 메뉴

꿈 많은 사람의 이야기

R ggplot2를 이용해 그래프 공부 하기 - 1 본문

R

R ggplot2를 이용해 그래프 공부 하기 - 1

이수진의 블로그 2017. 11. 16. 11:40
반응형
728x170

 

ggplot2은 R에서 많이 사용되는 그래프 패키지이다

다양한 그래프들이 존재하며 사용하기 쉽게 되어 있습니다

그리고 색상 추가 등의 기능도 있어서 알아보기 쉽게 사용할 수 있습니다

ggplot이 없으시면 install.packages("ggplot2")를 통해 설치하시면 됩니다

 

ggplot2에서 데이터를 그리는데 순서가 있습니다

1. 먼저 배경을 그립니다

2. 그래프를 그립니다

3.  설정을 추가합니다(색, 축 범위 등)

 

순서대로 진행해보죠

먼저 library로 ggplot을 가지고 옵니다. 그리고 그래프를 그려보죠

 

위 처럼하면 그래프가 그려집니다

ggplot2에 있는 mpg 데이터로 진행했습니다

data를 mpg로 설정, x축은 배기량, y축은 고속도로 연비 값으로 두었습니다

 

 

x축, y축을 통해 그래프가 그려졌죠?

이제 이 배경에 그래프를 그려봅니다

geom_point는 산점도를 그려줍니다

 

여기서 특징이 추가해주는 것은 + 로 해준다는 겁니다!

앞서 dplyr 패키지에서는 %>%로 추가해줬는데요

여기서는 + 로 해줍니다

 

 

 

자 그러졌네요!

신기하죠?

이제 3번째 단계인 축을 설정해 볼 수 있습니다

xlim과 ylim을 사용하면 됩니다

 

x는 3부터 6까지, y는 10부터 30까지로 설정했어요

이제 출력을 해보겠습니다

 

 

범위가 바뀌었죠? 이런식으로 사용하면 됩니다

 

그런데 qplot이라는 그래프도 있습니다

이것과 ggplot2의 차이점은 무엇일까요?

qplot은 주로 간단하게 전처리 작업으로 볼 때 많이 사용한다고 합니다. 기능이 많이 없지만 빠르게 확인할 수 있으니까요

ggplot은 다양한 그래프, 색, 크기 등을 표시할 수 있기 때문에 주로 최종 보고에 많이 쓰입니다.

사용 상황에 따라 다르게 쓰면 되는것이죠

 

이제 산점도를 해봤으니 평균 막대 그래프를 그려보죠

평균 막대 그래프를 그릴려면 먼저 데이터 프레임이 필요합니다!

dplyr 패키지를 사용해서 데이터 프레임을 짜보죠

 

 

df_mpg 변수에 mpg 값에서 drv를 그룹으로 묶고 그것에 따른 평균 연비를 넣었습니다

 

 

위와 같이 출력이 되네요!

이제 막대 그래프를 그려보죠!

geom_col 함수는 막대 그래프를 그려줍니다

 

 

 

이렇게 그릴 수 있습니다!

f가 가장 높네요!

 

이것을 높은 것부터 정렬하고 싶으시면 아래처럼 하면 됩니다!

reorder를 통해서 mean_hwy를 내림차순으로 정렬하는 것이죠!

-mean_hwy입니다!

 

 

 

 

 

이렇게 내림차순으로 정렬이 되었네요!

 

이제 빈도 막대 그래프를 그려볼게요

빈도 막대 그래프는 y축 설정이 필요 없습니다

왜냐하면 말 그래도 빈도를 나타내 주니까요

x축에 어떤 빈도 값을 할 것인지만 설정하면 알아서 출력해줍니다

 

 

geom_bar가 빈도 막대 그래프입니다!

 

 

이렇게 출력이 되네요!

여기까지가 이번 그래프 공부 포스팅이었습니다!

 

 

 

반응형
그리드형
Comments