728x90
선그래프
시간의 변화에 따라 자료를 수집한 경우 이를 시계열 자료(times series data)라고 한다.
시계열 자료를 분석할 때에는 다양한 분석 방법이 존재하는데 그중 선그래프를 통해서 증감 추이를 확인해보자.
선 그래프 작성
month | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
late | 5 | 8 | 7 | 9 | 4 | 6 | 12 | 13 | 8 |
R-Code
month <- 1:12 late <- c(5,8,7,9,4,6,12,13,8,6,6,4) plot(month, #x data late, #y data main="지각생 통계", #제목 type="l", #그래프의 종류 선택(알파벳) Line lty=1, #선의 종류(Line Type) 선택 lwd=1, #선의 굵기 선택 xlab="Month", #x축 레이블 ylab="Late cnt" #y축 레이블 ) |
선그래프를 작성하는 함수는 산점도를 작성할 때 사용한 plot()함수이다. plot() 함수에서 매개변수 type의 값을 "l"로 하면 선그래프가 작성된다. type의 값은 숫자가 아니라 알파벳이다. type의 값에 따른 선그래프의 종류는 다 다르다.
Type = "l" |
Type = "b" |
Type = "s" |
Type = "o" |
매개변수에서 lty는 선의 종류를 지정하는데 사용되며, 매개변수값에 따른 선의 종류는 각각 다르다.
그래프의 해석
지각생 수가 5월에 급감했다가 7,8월에는 급증하는 것을 알 수 있다. 이러한 관찰 결과를 바탕으로 7,8월에 왜 지각생이 급증하는지 원인을 파악해보고 지각생을 줄이기 위한 방안을 수립하는 것이 필요하다.
복수의 선그래프 작성
선그래프는 하나의 선뿐만 아니라 복수의 선도 나타낼 수 있다. 다음은 2개 반의 지각생 통계자료를 나타낸 것이다.
R-Code
month <- 1:12 late1 <- c(5,8,7,9,4,6,12,13,8,6,6,4) late2 <- c(4,6,5,8,7,8,10,11,6,5,7,3) plot(month, #x data late1, #y data main="Late Students", #제목 type="b", #그래프의 종류 선택(알파벳) Line lty=1, #선의 종류(Line Type) 선택 col="red", #선의 색 선택 xlab="Month", #x축 레이블 ylab="Late cnt", #y축 레이블 ylim=c(1,15) #y축 하/상한 값 ) |
먼저 late1로 plot()함수를 사용하여 선그래프를 작성한다.
lines(month, late2, type ="b", col ="blue") |
lines() 함수는 plot() 함수로 작성한 그래프 위에 선을 겹쳐서 그리는 역할을 한다. 이때 사용한 자료는 2번의 자료인
late2이다. 이와 같이 코드를 작성하면 여러 개의 선이 겹쳐진 그래프를 그릴 수 있다.
반응형
'Data Science > R' 카테고리의 다른 글
[R] 그래프 시각화 총정리 ( EDA 탐색적 분석 ) (0) | 2020.06.16 |
---|---|
[R] 그래프 시각화 ( 상관분석 , Correlation analysis , 상관계수 r) (0) | 2020.06.15 |
[R] 그래프 시각화 ( 산점도 scatter plot, scatter graph) (0) | 2020.06.15 |
[R]. 그래프 시각화 ( 사분위수 , 히스토그램 , 상자그림 ) (0) | 2020.06.11 |
[R]. 그래프 시각화 ( 도수분표표 , 막대그래프 , 원그래프 ) (0) | 2020.06.11 |