Data Science/R

[R] 그래프 시각화 ( 선그래프 , graph , line graph )

Acdong 2020. 6. 16. 15:46
728x90

선그래프

시간의 변화에 따라 자료를 수집한 경우 이를 시계열 자료(times series data)라고 한다.

시계열 자료를 분석할 때에는 다양한 분석 방법이 존재하는데 그중 선그래프를 통해서 증감 추이를 확인해보자.

 

선 그래프 작성

month 1 2 3 4 5 6 7 8 9
late 5 8 7 9 4 6 12 13 8

R-Code

month <- 1:12
late <- c(5,8,7,9,4,6,12,13,8,6,6,4)
plot(month,                                   #x data
      late,                                       #y data
      main="지각생 통계",                  #제목
      type="l",                                 #그래프의 종류 선택(알파벳) Line
      lty=1,                                     #선의 종류(Line Type) 선택
      lwd=1,                                    #선의 굵기 선택
      xlab="Month",                          #x축 레이블
      ylab="Late cnt"                         #y축 레이블
)

 

선그래프를 작성하는 함수는 산점도를 작성할 때 사용한 plot()함수이다. plot() 함수에서 매개변수 type의 값을 "l"로 하면 선그래프가 작성된다. type의 값은 숫자가 아니라 알파벳이다. type의 값에 따른 선그래프의 종류는 다 다르다.

 

Type = "l"

Type = "b"

Type = "s"

Type = "o"

매개변수에서 lty는 선의 종류를 지정하는데 사용되며, 매개변수값에 따른 선의 종류는 각각 다르다.

그래프의 해석

지각생 수가 5월에 급감했다가 7,8월에는 급증하는 것을 알 수 있다. 이러한 관찰 결과를 바탕으로 7,8월에 왜 지각생이 급증하는지 원인을 파악해보고 지각생을 줄이기 위한 방안을 수립하는 것이 필요하다.


복수의 선그래프 작성

선그래프는 하나의 선뿐만 아니라 복수의 선도 나타낼 수 있다. 다음은 2개 반의 지각생 통계자료를 나타낸 것이다.

 

R-Code

month <- 1:12
late1 <- c(5,8,7,9,4,6,12,13,8,6,6,4)
late2 <- c(4,6,5,8,7,8,10,11,6,5,7,3)
plot(month,                                   #x data
      late1,                                      #y data
      main="Late Students",                 #제목
      type="b",                                #그래프의 종류 선택(알파벳) Line
      lty=1,                                     #선의 종류(Line Type) 선택
      col="red",                                #선의 색 선택   
      xlab="Month",                          #x축 레이블
      ylab="Late cnt",                        #y축 레이블
      ylim=c(1,15)                             #y축 하/상한 값
)

먼저 late1로 plot()함수를 사용하여 선그래프를 작성한다.

 

lines(month,
       late2,
       type ="b",
       col ="blue")

lines() 함수는 plot() 함수로 작성한 그래프 위에 선을 겹쳐서 그리는 역할을 한다. 이때 사용한 자료는 2번의 자료인

late2이다. 이와 같이 코드를 작성하면 여러 개의 선이 겹쳐진 그래프를 그릴 수 있다.

반응형