R 시각화

    [R] 그래프 시각화 ( 상관분석 , Correlation analysis , 상관계수 r)

    상관분석과 상관계수 상관분석은 위의 그래프 처럼 자동차의 중량과 연비 간의 관계를 나타낸다. 자동차의 중량이 커지면 연비는 감소하는 추세를 보여주는데. 추세의 모양이 선(line)이어서 중량과 연비는 '선형적 관계'에 있다고 표현한다. 그런데 그래프의 따라 직선(회귀선)과 관측값들의 분포가 가깝거나 먼 것을 확인할 수 있다. 그래서 선형적 관계라고 해도 강한 선형적 관계가 있고 약한 선형적 관계도 있는 것이다. 상관분석은 두 변수 x 와 y 사이의 선형성 정도를 측정하는 방법으로 다음과 같이 정의된다. 상관계수는 선형성의 정도를 나타내는 척도로 사용된다. 상관계수는 r 은 다음과 같은 성질이있다. -1

    [R] 그래프 시각화 ( 산점도 scatter plot, scatter graph)

    산점도(scatter plot, scatter graph) 2개의 변수로 구성된 자료의 알아보는 그래프 다중 변수 자료(또는 다변량 자료)는 변수가 2개 이상인 자료를 말한다. 예를 들어, 사람들의 키와 몸무게가 서로 관계가 있는지 알아본다고 하면 '키'와 '몸무게'라고 하는 2개의 변수가 관련이 된다. 따라서 다중 변수 자료는 2차원 형태를 나타내며, 이는 행렬이나 데이터 프레임에 저장하여 분석을 실시한다. 두 변수 사이의 산점도 관측값들의 분포를 통해 2개의 변수 사이의 관계를 파악할 수 있는 기법이다. ex) mtcars 데이터셋에서 자동차의 중량과 연비 사이의 관계 R-code wt