R시각화

    [R] 그래프 시각화 총정리 ( EDA 탐색적 분석 )

    탐색적 데이터 분석 과정 실습 데이터 셋 변수 설명 변수 설명 crim 지역의 1인당 범죄율 rm 주택 1가구당 방의 개수 dis 보스턴의 5개 직업 센터까지의 거리 tax 재산세율 medv 주택 가격 1단계 : 분석 대상 데이터셋 준비 R-Code install.packages("mlbench") library(mlbench) data("BostonHousing") myds

    [R] 그래프 시각화 ( 선그래프 , graph , line graph )

    선그래프 시간의 변화에 따라 자료를 수집한 경우 이를 시계열 자료(times series data)라고 한다. 시계열 자료를 분석할 때에는 다양한 분석 방법이 존재하는데 그중 선그래프를 통해서 증감 추이를 확인해보자. 선 그래프 작성 month 1 2 3 4 5 6 7 8 9 late 5 8 7 9 4 6 12 13 8 R-Code month

    [R]. 그래프 시각화 ( 사분위수 , 히스토그램 , 상자그림 )

    사분위수 주어진 자료에 있는 값들을 크기순으로 나열했을 때 이것을 4등분하는 지점에 있는 값들을 의미한다. 자료에 있는 값들을 4등분하면 등분점이 3개 생기는데, 앞에서 부터 '1사분위수(Q1)' , '2사분위수(Q2)''3사분위수(Q3)'라고 부르며, 2사분위수(Q2)는 중앙값과 동일하다. 전체 자료를 4개로 나누었기 때문에 4개의 구간에는 각각 25%의 자료가 존재한다. 사분위수 예 평균이나 중앙값이 하나의 값으로 전체의 특성을 추정해볼 수 있는 도구인 것처럼 사분위수는 세 개의 값으로 전체의 특성을 추정하는 데 사용되며, 하나의 값 보다는 세 개의 값으로 전체의 특성을 추정하기 때문에 보다 많은 정보를 줄 수 있다. 예를 들어, 100명의 학생을 대상으로 영어 시험을 본 결과에 대해 사분위수를 Q1..

    [R]. 그래프 시각화 ( 도수분표표 , 막대그래프 , 원그래프 )

    도수분표표의 작성 WINTER SUMMER SPRING SUMMER SUMMER FALL FALL SUMMER SPRING SPRING 위에 형태의 자료를 분석하기 위해서 먼저 종류별로 개수를 세고, 종류별 비율을 계산해야한다. R - 코드 favorite