1장. 데이터의 이해
데이터의 정의?
객관적 사실 | 존재적 특성 |
추론, 예측 , 전망 추정을 위한 | 당위적 특성 |
하나로는 의미가 없고 객체와 상호관계 속에서 가치를 갖는다.
데이터의 유형
정성적 데이터 | 언어 , 문자 |
정량적 데이터 | 수치 , 기초 , 도형 |
지식경영
암묵지 + 형식지의 상호작용 속에서 지식이 공유되며 생성이 된다.
암묵지 : 학습과 체험을 통해 개인에게 습득 ( 공유되기 어려움 ) " 노하우 " , " 김장김치담그기 " , " 자전거타기 "
형식지 : 형상화된 지식 " 교과서", "메뉴얼" , " 비디오" ( 지식의 공유가 용이 )
암묵지 + 형식지의 4단계 지식전환 모드
1단계 | 공통화 | 암묵지 지식 노하우를 다른 사람에게 알려주는 것 |
2단계 | 표출화 | 암묵적 지식 노하우를 책이나 교본 등 형식지로 만드는 것 |
3단계 | 연결화 | 책이나 교본(형식지)에 자신이 알고 있는 새로운 지식(형식지)를 추가하는 것 |
4단계 | 내면화 | 만들어진 책이나 교본(형식지)을 보고 다른 직원들이 암묵적 지식(노하우)을 습득 |
-> 이것을 SECL 모델 ( Socialization - Externalization - Combination - Internalization Model )
데이터와 정보와의 관계
Data - Information - Knowledge - Wisdom 계층구조는 데이터의 당위적 특징과 관련
Data : 존재 형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호 A 마트 100원 , B 마트는 200원 연필을 판매 |
Information : 데이터의 가공 및 상관관계가 이해를 통해 패턴을 인식하고 의미 부여 A 마트의 연필가격이 더 싸다. |
Knowledge : 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물 상대적으로 저렴한 A마트에서 연필을 사야겠다. |
Wisdom : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 아이디어 A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단 |
관계형 데이터베이스 관리시스템(RDBMS) vs 객체 지행 데이터베이스 관리시스템(ODBMS)
관계형 데이터베이스 관리시스템(RDBMS)
일련의 정형화된 테이블로 구성된 데이터 항목들의 집합체로서,
그 데이터들을 데이터베이스 테이블을 재구성하지 않더라도 다양한 방법으로 접근하거나 조합이 가능
oracle , mysql
객체 지향 데이터베이스 관리시스템(ODBMS)
객체들을 생성하여 계층에서 체계적으로 정리하고, 다시 계층들을 하위 계층이 상위 계층으로부터 속성과
방법들을 물려받을 수 있는 계승 가능한 구조로 구성됨
데이터 베이스 특징
통합된 데이터 | 데이터베이스에서 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미 |
저장된 데이터 |
컴퓨터가 접근할 수 있는 저장매체에 저장되는 것을 의미 |
공용 데이터 | 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동 이용 |
변화되는 데이터 | 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야한다는 의미 |
정보측면
정보의 축적 및 전달 측면 | 대량의 정보를 정보처리기기가 읽고 쓸 수 있음 |
정보 이용 측면 | 이용자의 요구에 따라 신속하게 정보획득 |
정보 관리 측면 | 대량의 정보를 체계적으로 축적하고 새로운 내용 추가 갱신 용이 |
정보기술발전 측면 | 다른 IT산업분야의 발전을 견인함 |
경제/산업적 측면 | 경제 , 산업 , 사회활동의 효율성제고 국민의 편의 증진 |
기업내부 데이터베이스 솔루션
1980년대 기업 내부 데이터베이스
OLTP - 온라인 거래처리 여러 과정이 하나의 단위 프로세스로 실행되도록 하는 프로세스 |
OLAP - 온라인 분석처리 다차원으로 이루어진 데이터로부터 통계적인 요약정보 제공 기술 |
2000년대 기업 내부 데이터베이스
CRM | 선별된 고객으로 수익을 창출하고 장기적인 고객관계를 가능케함으로써 보다 높은 이익을 창출 할 수 있는 솔루션 |
SCM |
제조, 물류 , 유통업체 등 유통공급망에 참여하는 모든 업체들이 협력을 바탕으로 정보기술을 활용 |
분야별 기업내부 데이터 베이스 솔루션
제조부문
- DW
- ERP : 주요프로세스 관리를 돕는 여러 모듈로 구성된 통합 애플리케이션 소프트웨어 패키지
- BI
- CRM
실시간 기업 ( Real Time Enterprise )
RTE 는 최신의 정보를 실시간으로 전달하여 즉각적인 모니터링과 신속한 대응이 가능한 기업
금융부문
- EAI : 여러 애플리케이션을 통합해서 쓰는 것
- EDW : 기존데이터 웨어하우스를 확장한 모델 , 데이터의 중복 방지 등을 위해 시스템을 재설계
- 블록체인 : 공공거래 장부 , 분산거래 장부 , 분산 데이터처리 기술 네트워크 참여하는 모든 사용자가 모든 거래내역 등의 데이터를 분산
유통부문
- KMS : 지식관리시스템의 약자 , 지적재산이 중요해짐에 따라 기업을 관리하는 시스템이 등장
- RFID : 무선주파수를 이용하여 대상을 식별할 수 있는 기술 ( 마트 )
- CRM
- SCM
BI 와 BA 차이
구분 | BI(Business Intelligence) | BA(Business Analytics) |
목적 | 과거의 성과를 측정하고 향후 비즈니스를 계획 | 데이터와 통계를 기반으로 성과에 대한 이해와 비즈니스 통찰력에 초점을 둔 분석 방법 |
응용 | 데이터 기반의 의사결정 | 사전에 예측하고 촤적화하기 위함 BI 보다 진보된 형태 |
Q1. 데이터의 가공 및 처리와 데이터간 연관관계 속에서 의미가 도출된 것을 무엇이라 하는가 ?
(드레그하면 정답 보임)
정보(Information)
Q2. 내재된 경험을 문서나 매채로 저장하는 것은?
- 표출화
- 공통화
- 내면화
- 연결화
'Data Science > ADsP' 카테고리의 다른 글
[ADsP]3과목 - 1장. R 기초(R의 기초통계, 데이터 핸들링,R그래프의 이해) (0) | 2020.05.22 |
---|---|
[ADsP] 2과목 - 2장. 분석 마스터 플랜 (0) | 2020.05.20 |
[ADsP] 2과목 - 1장. 데이터 분석 기획의 이해 ( 2 ) (0) | 2020.05.19 |
[ADsP] 2과목 - 1장. 데이터 분석 기획의 이해 ( 1 ) (0) | 2020.05.19 |
[ADsP] 1과목 - 2장. 데이터의 가치와 미래 (0) | 2020.05.19 |