plot()

    [기계학습]. 다중선형회귀(Multiple Linear Regression)실습 Python code -예제

    실습데이터 및 파이썬 script 실습에 사용된 라이브러리 import os import pandas as pd import numpy as np import statsmodels.api as sm from sklearn.model_selection import train_test_split Pandas 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구 numpy 다차원 배열을 처리하는데 필요한 여러 유용한 기능을 제공 statsmodels 검정 및 추정 , 회귀분석, 시계열분석등의 다양한 통계분석 기능을 제공 patsy 패키지를 포함하고 있어 기존에 R에서만 가능했던 회귀분석과 시계열분석 방법론을 그대로 파이썬에서 이용할 수 있..

    [R] 그래프 시각화 총정리 ( EDA 탐색적 분석 )

    탐색적 데이터 분석 과정 실습 데이터 셋 변수 설명 변수 설명 crim 지역의 1인당 범죄율 rm 주택 1가구당 방의 개수 dis 보스턴의 5개 직업 센터까지의 거리 tax 재산세율 medv 주택 가격 1단계 : 분석 대상 데이터셋 준비 R-Code install.packages("mlbench") library(mlbench) data("BostonHousing") myds

    [R] 그래프 시각화 ( 산점도 scatter plot, scatter graph)

    산점도(scatter plot, scatter graph) 2개의 변수로 구성된 자료의 알아보는 그래프 다중 변수 자료(또는 다변량 자료)는 변수가 2개 이상인 자료를 말한다. 예를 들어, 사람들의 키와 몸무게가 서로 관계가 있는지 알아본다고 하면 '키'와 '몸무게'라고 하는 2개의 변수가 관련이 된다. 따라서 다중 변수 자료는 2차원 형태를 나타내며, 이는 행렬이나 데이터 프레임에 저장하여 분석을 실시한다. 두 변수 사이의 산점도 관측값들의 분포를 통해 2개의 변수 사이의 관계를 파악할 수 있는 기법이다. ex) mtcars 데이터셋에서 자동차의 중량과 연비 사이의 관계 R-code wt