반응형
728x170
안녕하세요~
이번 포스팅은 로또 분석 2단계 포스팅입니다!
579~779회분 데이터를 이용해서 어떤 숫자가 많이 나왔는지 분석해보겠습니다~
R 프로그래밍을 이용했고요
데이터는 로또 사이트에서 엑셀파일로 받았습니다
이렇게 엑셀파일이 구성되어 있습니다
전 여기서 금액 이런거 다 필요 없고 당첨번호만 가지고 분석을 해볼 겁니다
지난주 로또 회수 779회부터 2014년 579회까지 데이터를 가지고 어떤 숫자가 많이 나왔는지 보겠습니다
엑셀 파일을 받기 위해 엑셀 라이브러리를 갖고 옵니다
그리고 lotto2.xlsx 파일을 가지고 와요
전 미리 저 숫자들의 데이터만 따로 빼놨습니다
그리고 table을 이용해서 빈도수를 봐보죠
아래 사진이 빈도수입니다
숫자 1은 28번, 45는 29번 등 카운트가 세어졌습니다
어떤건 41번까지 카운트됐네요
숫자마다 나온 빈도수가 달라요
이걸 시각적으로 한 번 봐볼까요?
저렇게만 보면 차이를 잘 모르겠죠 ㅎㅎ
ggplot2를 이용할겁니다
그리고 저 table 값을 lott3라는 변수에 새로 담고요
data.frame을 통해 프레임을 만들어줍니다
프레임 구조는 위와 같이 되어있어요
그리고 lotto 번호와, Freq 즉 빈도수를 y 축으로 해서 출력하면 아래 사진처럼 나옵니다
신기하죠?
22, 29, 32, 26은 빈도수가 적네요
7, 33 등의 빈도수는 다른 거에 비해 높고요
200회분치 뿐이 안돼서 데이터가 많진 않지만 그래도 나름 흥미롭네요 ㅎㅎ
반응형
그리드형
'R' 카테고리의 다른 글
R 데이터 합치기(left_join, bind_rows) 공부하기 (0) | 2017.11.10 |
---|---|
R 데이터 다루기(filter, select, summarise ,정렬 등)를 공부해봐요 (0) | 2017.11.09 |
R 조건문(ifelse)를 알아보자 (0) | 2017.11.07 |
R 데이터 프레임 다루기 (0) | 2017.11.03 |
R CSV 파일 불러오기 (0) | 2017.11.01 |