728x90
도수분표표의 작성
WINTER | SUMMER | SPRING | SUMMER | SUMMER |
FALL | FALL | SUMMER | SPRING | SPRING |
위에 형태의 자료를 분석하기 위해서 먼저 종류별로 개수를 세고, 종류별 비율을 계산해야한다.
R - 코드
favorite <- c('WINTER','SUMMER','SPRING','SUMMER','SUMMER', 'FALL','FALL','SUMMER','SPRING','SPRING') favorite # favorite의 내용 출력 table(favorite) # 도수분포표 계산 table(favorite)/length(favorite) # 비율 출력 |
막대그래프 작성
도수분포표를 작성하는 것만으로도 단일변수 범주형 자료가 포함하고 있는 정보를 파악할 수 있지만,
이 결과를 가지고 막대그래프를 작성하여 정보를 시각화하면 정보의 파악이 보다 쉬워진다.
ds <- table(favorite) ds barplot(ds, main='favorite season') |
main 은 막대그래프 상단의 타이틀을 지정하는 매개변수로 위에서는 'favorite season'를 입력했다.
원그래프 작성
하나의 원 안에서 각 자료값이 차지하는 비율을 넓이로 나타낸 그래프.
ds <- table(favorite) ds pie(ds, main='favorite season') |
숫자로 표현된 범주형 자료
- M,F 와 같이 문자열을 1,2로 표현하기
- 초록,빨강,파랑을 1,2,3으로 표현하기
favorite.color <- c(2,3,2,1,1,2,2,1,3,2,1,3,2,1,2) ds <- table(favorite.color) ds |
barplot(ds,main='favorite color') |
colors <-c('green','red','blue') names(ds) <- colors ds |
barplot(ds,main='favorite color',col=colors) |
pie(ds, main='favorite season',col=colors) |
범주형 자료의 값은 크기를 갖지 않기 때문에 도수분포를 계산한 다음
이를 막대그래프나 원그래프로 시각화하여 자료의 내용을 파악할 수 있다.
반응형
'Data Science > R' 카테고리의 다른 글
[R] 그래프 시각화 ( 산점도 scatter plot, scatter graph) (0) | 2020.06.15 |
---|---|
[R]. 그래프 시각화 ( 사분위수 , 히스토그램 , 상자그림 ) (0) | 2020.06.11 |
[R] R , R studio 설치 및 한글 깨짐 해결법 (0) | 2020.06.10 |
[R] 기본 요약 정리 ( data frame , 데이터 읽기/쓰기 , apply() 함수 , 데이터 찾기 ) (1) | 2020.05.12 |
[R] 기본 요약 정리 ( 연산 , 자료형 , vector , factor , list ) (0) | 2020.05.12 |