R

    [R] 그래프 시각화 ( 상관분석 , Correlation analysis , 상관계수 r)

    상관분석과 상관계수 상관분석은 위의 그래프 처럼 자동차의 중량과 연비 간의 관계를 나타낸다. 자동차의 중량이 커지면 연비는 감소하는 추세를 보여주는데. 추세의 모양이 선(line)이어서 중량과 연비는 '선형적 관계'에 있다고 표현한다. 그런데 그래프의 따라 직선(회귀선)과 관측값들의 분포가 가깝거나 먼 것을 확인할 수 있다. 그래서 선형적 관계라고 해도 강한 선형적 관계가 있고 약한 선형적 관계도 있는 것이다. 상관분석은 두 변수 x 와 y 사이의 선형성 정도를 측정하는 방법으로 다음과 같이 정의된다. 상관계수는 선형성의 정도를 나타내는 척도로 사용된다. 상관계수는 r 은 다음과 같은 성질이있다. -1

    [R]. 그래프 시각화 ( 사분위수 , 히스토그램 , 상자그림 )

    사분위수 주어진 자료에 있는 값들을 크기순으로 나열했을 때 이것을 4등분하는 지점에 있는 값들을 의미한다. 자료에 있는 값들을 4등분하면 등분점이 3개 생기는데, 앞에서 부터 '1사분위수(Q1)' , '2사분위수(Q2)''3사분위수(Q3)'라고 부르며, 2사분위수(Q2)는 중앙값과 동일하다. 전체 자료를 4개로 나누었기 때문에 4개의 구간에는 각각 25%의 자료가 존재한다. 사분위수 예 평균이나 중앙값이 하나의 값으로 전체의 특성을 추정해볼 수 있는 도구인 것처럼 사분위수는 세 개의 값으로 전체의 특성을 추정하는 데 사용되며, 하나의 값 보다는 세 개의 값으로 전체의 특성을 추정하기 때문에 보다 많은 정보를 줄 수 있다. 예를 들어, 100명의 학생을 대상으로 영어 시험을 본 결과에 대해 사분위수를 Q1..

    [R]. 그래프 시각화 ( 도수분표표 , 막대그래프 , 원그래프 )

    도수분표표의 작성 WINTER SUMMER SPRING SUMMER SUMMER FALL FALL SUMMER SPRING SPRING 위에 형태의 자료를 분석하기 위해서 먼저 종류별로 개수를 세고, 종류별 비율을 계산해야한다. R - 코드 favorite

    [R] 기본 요약 정리 ( 연산 , 자료형 , vector , factor , list )

    RStudio 패키지 설치 및 사용 #패키지 설치 install.packages("패키지 이름") #패키지 사용 library("패키지 이름") 산술 연산 함수 함수 의미 사용 예 log() 로그함수 log(10), log(10, base = 2) sqrt() 제곱근 sqrt(36) max() 가장 큰 값 max(3,9,5) min() 가장 작은 값 min(3,9,5) abs() 절대값 abs(-10) factorial() 팩토리얼 factorial(5) sin(), cos() , tan() 삼각함수 sin(pi/2) R에서 사용할 수 있는 값들의 자료형 자료형 사용 예 비고 숫자형 1,2,3, -4, 12.8 정수와 실수 모두 가능 문자형 'Tom' , 'Jane' 작은 따옴표나 큰 따옴표로 묶어서 표..