머신러닝(Machine Learning)이란?
인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다.
출처 : 위키피디아
한국어로 직역하면 기계학습,
인간이 하나부터 열까지 직접 가르치는 기계를 의미하는 것이 아니라,
학습할 거리를 일단 던져놓으면 이걸 가지고 스스로 학습하는 기계를 의미합니다.
머신러닝은 무엇(X)으로 무엇(Y)를 예측하고싶을 때 사용한다.
행렬(Matrix)로 이루어진 데이터를 가지고 머신러닝을 진행합니다.
X(독립변수) : 성별 , 키 , 몸무게 , 체지방 , BMI지수 , 폐활량
Y(종속변수) : 흡연여부
성별 , 키 , 몸무게 , 체지방, BMI지수 , 폐활량을 가지고 머신러닝 과정을 거치면 흡연을 하는 지 안하는 지 예측할 수 있다,
머신러닝의 사용은 크게 두 가지로 나뉜다.
1 . 주어진 데이터를 통해서 입력변수와 출력변수간의 관계를 만드는 함수 f(x)를 만드는 것
2. 주어진 데이터(x)를 통해서 데이터의 특징을 찾아내는 함수f(x)를 만드는 것
- x 들 간의 숨겨진 패턴을 찾아내고 새로운 특징을 찾아내는 함수 f(x)를 만드는 것
Machine Learning 으로 할 수 있는 것들
고객들의 개인 정보 및 금융관련 정보(X) 를 통해서 대출 연체여부(Y) -> 대출 연체자 예측탐지모델
게임유저들의 게임 내 활동 정보(X)를 통해서 게임 이탈 여부(Y) / 어뷰징 여부 -> 이상 탐지 모델
쇼핑몰 페이지 검색 및 클릭 로그 기록(X) -> 맞춤 추천 시스템
회귀분석에서의 머신러닝
p 개의 입력 변수 X1,X2,...Xp 가 있고, 출력 변수 Y가 있을 때,
X = (X1,X2,….,Xp)라 하면 입력 변수와 출력변수의 관계를 나타내는 식은 다음과 같음.
f 는 예측값이고 실제 Y의 값을 구하려면 예측값의 E(오차항)을 더해줘야 실제값을 구할 수 있다.
우리는 대한민국 4700만(모집단)에 대한 평균 키를 알 수 없기 때문에 표본을 추출(학습데이터)해서 학습시킨다.
표본을 추출해서 학습시킨 결과는 추정을 한 것이기 떄문에 Y 와 f 에 모자를 씌우고 Y헷 , f헷 이라고 읽습니다.
'Machine learning' 카테고리의 다른 글
[Machine Learning] 단순선형회귀분석(Simple Linear Regression) 예제 ,pandas , numpy , plot (0) | 2020.05.11 |
---|---|
[기계학습]회귀계수의 의미 , 희귀계수 검정 ( SST , SSE , SSR , P-value ) (0) | 2020.04.28 |
[기계학습]회귀분석 , 회귀계수 추정 , Matrix 미분 활용 (0) | 2020.04.22 |
[기계학습]과적합(overfitting)이란? (0) | 2020.03.25 |
[기계학습]지도학습과 비지도학습 (0) | 2020.03.19 |