분석 과제 발굴
하향식 접근 방식 vs 상향식 접근 방식
하향식 접근 방식
문제탐색 단계(Problem Discovery) 단계
비즈니스 모델 기반 문제 탐색 ( 단기적인 관점 )
캔버스의 9가지 블록을 단순화
- 업무(Operation) ex ) 생산공정 최적화 , 재고량 최소화
- 제품(Product) ex ) 제품의 주요 기능 개선
- 고객(Product) ex ) 고객 전화 대기 시간 최소화
와 이를 관리하는 두 가지 영역인 - 규제와 감사 ( Audit & Requlation)
- 지원 인프라 ( IT & Human Resource )
영역 추가 도출
분석 기회 발굴의 범위 확장 ( 장기적인 관점 )
거시적 관점의 요인(STEEP)
- 사회(Social)
- 기술(Technological)
- 경제(Economic)
- 환경(Environmental)
- 정치(Political)
경쟁자 확대 관점
- 사업자영역
- 경쟁사영역
- 신규진입자영역
으로 나눠 폭넓게 탐색
시장의 니즈 탐색
채널 영역 및 고객의 구매와 의사결정에 미치는 영향자들 영역에 대한 관점
역량의 재해석 관점
조직의 비즈니스 영햐을 미치는 파트너 영역을 포함.
3. 외부 참조 모델 기반 문제 탐색
4. 분석 유즈 케이스
분석 유즈케이스 정의서를 보고서 다음 문제를 정의한다.
문제정의 단계 ( Problem Definition)
식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계.
필요한 데이터 및 기법을 정의하기 위한 변환 수행
고객이탈의 증대 ( 비즈니스 문제 )를
고객의 이탈에 영향을 미치는 요인을 식별하고 이탈 가능성 예측(데이터 분석 문제)로 변환
해결 방안 탐색(Solution Search) 단계
어떤 데이터 또는 분석 시스템을 사용할 것인지 다각도로 고려
엑셀로도 가능? 하둡을 통해 분산병렬처리를 활용? 전문인력 채용 등..
타당성 검토(Feasibility Study)
- 경제적 타당도 : 비용 대비 편익 분석
- 데이터 및 기술적 타당도 : 데이터 존재 여부, 시스템 환경 , 역량
상향식 접근 방식
하향식은 논리적인 단계적 접근 방식
문제가 복잡해지고 다양해지면 적합하지않아 상향식 접근방식 사용.
Unsupervised Learning , 군집분석
문제가 없다. 상관분석 또는 연관분석을 통해 문제 해결에 도움을 받을 수 있다.
시행창오를 통한 문제 해결
- 하향식 접근방식은 문제가 정형화 되어있을 경우 효과적
프로토타이핑 접근법
대표적 상향식 접근 방법으로 데이터를 정확히 규정하기 어려운 상황에서
반복적으로 개선해 나가는 방법 가장 신속하고 간단하게 만들어보는것
-
하향식 접근법 : 해법을 찾아라
-
상향식 접근법 : 데이터가 말하게 하라
-
프로토타이핑 접근법 : 시행착오로 찾아라
빅 데이터 분석 환경에서 프로토타이핑 필요성
- 문제에 대한 인식 수준 : 불명확, 새로운 문제
- 필요데이터 존재 여부의 불확실성 : 필요 데이터 집합이 존재하지 않음
- 데이터 사용 목적의 가변성 : 데이터는 지속적으로 변함
분석 과제 정의서
분석프로젝트와 일반프로젝트의 차이점
분석 과제의 주요 5가지 특성 관리 영역
Data Size | 분석하고자 하는 데이터양을 고려한 관리 방안 |
Data Complexity ( 복잡도) | 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 고려 |
Speed | 실시간 분석의 형태인지 고려 |
Analytic Complexity | 모델이 복잡할 수록 정확도는 올라가지만 해석이 어려워지는 단점이 있어 사전에 정의 |
Accuracy & Precision ( Trade off 관계 ) |
Accuracy는 모델과 실제값 사이의 차이가 적다는 정확도를 의미 Precision은 모델을 반복했을 때 일관적으로 동일한 결과를 제시한다는 것을 의미 |
프로젝트 영역별 주요 관리 목록
분석 프로젝트 관리의 영역 10가지
통합 | 이해관계자 | 범위 | 자원 | 시간 | 원가 | 리스크 | 품질 | 조달 | 의사소통 |
Time Boxing 기법 - 반복형 개발 프로젝트관리기법 반복할당된 작업을 완수 못했을 경우 다음 과정으로 넘긴다.
Q1 . 동일한 사안이라고 해도 제시ㄹ되는 방법에 따라 그에 관한 해석이나 의사결정이 달라지는 인식의 왜곡현상을 무엇이라 하는가?
프레이밍 효과
Q2. 데이터 분석 방법론 중 KDD는 데이터 전처리(Preprocessing)에 분석 대상용 데이터셋 에 포함되어 있는 잡음(Noise)과 이상치(Outlier), 결측치(Missing Value)를 식별하고 필요시 제거하거나 의미 있는 데이터로 처리하는 데이터셋 정제작업을 시행한다. 또 다른 분석 방법인 CRISP-DM 분석 방법론 중 이와 유사한 프로세스 단계는 무엇인가? ?
데이터 준비단계
Q3. 정형-반정형-비정형 데이터 순서로 된 것은?
① Demand Forecast-Competitor- pricing-Email record
② RFID-sensor-loyalty
③ SNS media-sensor-ERP
④ Bar code system-internet of things sensing-Email
정형 | 반정형 | 비정형 |
Demand Forecast ERP |
Competitor-Pricing RFID |
Email record SNS Media |
Q4. 프로토타이핑 접근법에 대한 설명 중 적절하지 않은 것은?
① ‘사용자들이 이렇게 만들면 편하게 사용할 거야‘ 라는 가설을 생성하게 된다.
② 특정 가설을 갖고 서비스를 설계하고 디자인에 대한 실험도 실행한다.
③ 프로토타입을 보고 완성시킨 결과물을 통해 가설을 확인할 수 있다.
④ 프로토타이핑은 순환적 문제탐색으로 인해 개발시간이 많이 필요로한다.
시행착오를 줄임으로써 개발시간이 감소한다.
'Data Science > ADsP' 카테고리의 다른 글
[ADsP]3과목 - 1장. R 기초(R의 기초통계, 데이터 핸들링,R그래프의 이해) (0) | 2020.05.22 |
---|---|
[ADsP] 2과목 - 2장. 분석 마스터 플랜 (0) | 2020.05.20 |
[ADsP] 2과목 - 1장. 데이터 분석 기획의 이해 ( 1 ) (0) | 2020.05.19 |
[ADsP] 1과목 - 2장. 데이터의 가치와 미래 (0) | 2020.05.19 |
[ADsP] 1과목 - 1장. 데이터의 이해 (0) | 2020.05.18 |