분류 전체보기
[R]. 그래프 시각화 ( 도수분표표 , 막대그래프 , 원그래프 )
도수분표표의 작성 WINTER SUMMER SPRING SUMMER SUMMER FALL FALL SUMMER SPRING SPRING 위에 형태의 자료를 분석하기 위해서 먼저 종류별로 개수를 세고, 종류별 비율을 계산해야한다. R - 코드 favorite
[기계학습] 다중 선형 회귀 분석 ( 회귀 계수 , 모델에 대한 검정 )
2020/05/11 - [데이터사이언스/데이터분석 실습] - [기계학습] 단순선형회귀분석(Simple Linear Regression) 예제 ,pandas , numpy , plot [기계학습] 단순선형회귀분석(Simple Linear Regression) 예제 ,pandas , numpy , plot 먼저 회귀분석에 대해서 알아봅시다. 2020/04/22 - [데이터사이언스/머신러닝] - [기계학습] 4. 회귀분석 , 회귀계수 추정 , Matrix 미분 활용 [기계학습] 4. 회귀분석 , 회귀계수 추정 , Matrix 미분 활용 �� acdongpgm.tistory.com Machine Learning 머신러닝 다중 선형 회귀분석 전에 단순 선형회귀 분석에 대해 선행되어야 한다. 2020/04/22 -..
[R] R , R studio 설치 및 한글 깨짐 해결법
https://backgomc.tistory.com/34 R 프로그래밍 R 설치 및 R Studio 설치 방법 R 프로그래밍 R 설치 및 R Studio 설치 방법 1. R 설치 먼저 R을 설치하기전에 3가지 준비사항이 있습니다. 이는 나중에 작업시 오류 발생을 방지하기 위해서 입니다. 1. 컴퓨터의 이름은 한글로 하지 backgomc.tistory.com https://dataoil.tistory.com/5
[일상] 자위행위를 안하면 어떻게 될까? ( Nofap , 금욕 , 금딸 , 금란물 )
안녕하세요. 오늘은 조금 민감한 주제이지만 이 또한 우리의 삶의 일부이며 현재 생활에 만족하지 못하는 남성들에게 반드시 필요한 내용입니다. 해외에서는 Nofap이라는 금란 물, 금욕 운동이 커뮤니티로 서로 공유되며 활발하게 이루어지고 있습니다. 자위행위는 우리의 번식본능에 따라 아주 자연스러운 행위이고 혈기왕성한 남성들이 욕구를 참지 못하면 폭발하는 거 아니냐는 주기적으로 욕구를 해소해야 한다는 주장(비뇨기과)도 있지만 제가 앞으로 이야기할 내용은 아주 과학적인 근거가 있는 이야기들입니다. Nofap을 설명하기 앞서서 먼저 우리의 동력 호르몬인 도파민(dopamine)을 설명해드릴 텐데요. 도파민(dopamine)은 뇌신경 세포의 흥분을 전달하는 역할을 하는 신경전달물질의 하나입니다. 도파민은 욕구를 통..
[ADsP]3과목 - 4장.연관분석
연관분석 기업의 마케팅분야에 많이 활용 데이터의 거래정보(트렌젝션)를 연관석 규칙을 이용하여 장바구니 분석이라고함. 활용 매장 내 상품 진열 묶음 판매 쿠폰발행 교차판매 지지도 support(A->B) 의미는 IF A 구매 THEN B 도 구매 A와 B의 순서가 바뀌어도 상관이없음 신뢰도 신뢰도(A->B): 물품 A를 구매했다는 조건하에 물품 B를 구매확률 =P(B|A) 조건부 확률 신뢰도가 50% 이라는 의미는 “A를 구매한 거래 가운데 50% B도 구매” Confidence(A->B) ≠ Confidence(B->A) 순서를 바꾸게 되면 같지 않다. 향상도 향상도는(A->B) 전체에서 B가 거래된 비율과 / A가 구매되었다는가정하에 B가 구매된 비율사이의 비율 lift(A->B)=lift(B->A) ..
[ADsP]3과목 - 4장.군집분석,k평균군집,혼합분포군집,SOM(자기조직화지도)
군집분석 군집내는 동질적이게 군집외는 이질적이게 하는 것 분석대상 상호관련성에 의해 설 동질적인 집단으로 그룹핑 사전에 집단이 모르는 자료를 유사한 것들끼리 분류하여 군집 비지도학습(목표변수 없음) 계층적 군집분석 유사한 개체를 묶어 나가는 과정을 반복하여 원하는 갯수의 군집을 형성 응집형(병합방법) : Bottom-up 하나의 군집이 남을 때 까지 순차적으로 군집들을 병합 (계층적 군집분석에는 주로 병합 방법이 쓰임) 분리형(분리방법) : Top - down 하나의 군집에서 n개 군집으로 분리 군집 방법 두 군집 사이의 거리 단일 연결법 (single linkage) 한 군집의 점과 다른 군집의 점 사이의 가장 짧은 거리. ( 사슬 모양이 생길 수 있다.) 완전 연결법 (complete linkage)..
[ADsP]3과목 - 4장.의사결정나무, 앙상블 모형
의사결정나무 구성 의사결정나무 모형 구축 Split(가지 분할) -> 나무의 가지를 생성 Stopping rule(정지규칙) -> 더 이상 분리가 일어나지 않고 현재의 마디가 끝마디 (기준) 최대나무의 깊이 , 자식마디의 최소 관측치 수 , 카이제곱 통계량 , 지니지수, 엔트로피 지수 Pruning(가지치기) -> 생성된 가지를 잘라내어 단순화 끝마디가 너무 많으면 (Overfitting) (기준) 분류된 관측치의 비율 또는 MSE 의사결정나무 분리기준 목표변수의 분포를 구별하는 정도 : 순수도 or 불순도 순수도 : 목표변수 특정 범주에 개체들이 포함되어 있는 정도 부모마디의 순수도에 비해서 자식마디들의 순수도가 증가하도록 자식마디를 형성함. 분류기준 이산형 목표변수(분류나무) 각 범주에 속하는 빈도에..
[ADsP]3과목 - 4장.로지스틱회귀분석,신경망모형
로지스틱 회귀분석 종속변수가 "성공 또는 실패" , "흡연 또는 비흡연" 이항변수로 되어 있을 때 종속변수와 독립변수간의 관계식을 두 집단이상으로 분류하고자 할 때 사용되는 분석기법 일반선형 회귀분석 로지스틱 회귀분석 종속변수 연속형변수 이산형변수 모형 탐색 방법 최소자승법 최대우도법, 가중최소자승법 모형 검정 F-test, t-test X^2test 활용예시) TV 홈소핑 반품에 영향을 미치는 요인 변수 : 독립변수(소득,학력,성별,거주지,구매금액) , 종속변수(반품유무) 결과 : 20-30대의 젊은 여성, 고학력, 고소득일수록 반품률이 높음 로지스틱 회귀모형 종속변수가 두 가지 범주(Y or N)를 나타내는 이항변수일 경우 기댓값은 확률을 의미하므로 0~1사이의 값을 가지는 곡선형태의 모형이다. 부호..
[ADsP]3과목 - 4장.데이터마이닝,모형평가
데이터 마이닝 자동화(Automated) 숨겨진(Hidden) 예측가능(Predictive) 데이터마이닝 표본조사/실험에서 모형에 대한 전제조건이 필요하지 않음. 모집단의 전체자료를 이용하여 정보추출 대용량 자료 데이터마이닝 기법을 사용하기 위해 데이터웨어하우스가 필요하다. SQL 2019년 1월에 50만원 이상 구매 고객 OLAP 2019년 1월에 50만원 이상 구매,여자,미혼,년 소득이 5천만원 이상 Mining 미혼남,서울거주,년소득 3천만원,취미가 여행인 고객의 신용불량여부 예측 지도학습 종류 인공신경망 의사결정나무 판별분석 선형회귀분석 로지스틱 회귀분석 사례기반추론 지도학습은 명확한 입력변수와 목표변수가 존재하고 분류와 예측이 있다. 비지도학습 종류 OLAP 연관성규칙 군집분석 인자분석 주성분분..
[ADsP]3과목 - 3장.상관분석 및 다차원분석, 주성분분석,시계열 예측
상관분석 두 수치형 변수간의 선형성의 정도, 관련성을 파악하는 방법이다. 피어슨의 상관계수, 스피어만의 상관계수 , 켄달의 순위상관계수 등이 있다. 상관분석은 두 변수의 선형성의 정도를 알아보고 인과관계를 의미하는 것은 아니다. 회귀계수는 인과관계를 알아보는 것이다. 밑의 3, 4 번 그림은 상관계수가 0 일때 나타난다. 상관계수의 범위 -1