Data Science

[데이터 과학] 데이터(Datasets) 수집하기 좋은 사이트 모음

Acdong 2020. 7. 17. 09:16
728x90

데이터 분석에 필요한 재료 데이터들을 어디에서 수집할까요?

 

물론 회사에 들어가게 되면 회사 내에 데이터를 사용하기 되겠지만.

그것 외에도 많은 데이터를 수집할 수 있는 사이트가 있습니다.


1. 공공데이터 포털

https://www.data.go.kr/

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

공공데이터 포털은 가장 많이 사용하고 있는 국가기관들의 공공데이터들을 API의 형태로 다운로드할 수 있는

사이트입니다. 전국 부동산 , 범죄율 , 코로나 바이러스 등 국가기관이 수집한 데이터를 내가 수집할 수 있습니다.

 


2. 국가 통계 포털

http://kosis.kr/index/index.do

 

KOSIS 국가통계포털

 

kosis.kr

이것도 비슷함.

 


3. 마이크로데이터 통합 서비스(MDIS)

https://mdis.kostat.go.kr/index.do

 

국가통계 마이크로데이터 서비스 시스템

마이크로데이터는 일상의 의사결정에서 부터, 국가 주요정책결정에 이르기까지 다양한 분야에서 활용할 수 있습니다.

mdis.kostat.go.kr

여기까지가 공공데이터 수집 사이트들입니다.

 


기업데이터

 

그 외에 구글이나 , SK , Kaggle 등이 수집한 데이터도 자유로운 분석을 위해 공개하고 있습니다.

4. Awesome Public Datasets

https://github.com/awesomedata/awesome-public-datasets

 

awesomedata/awesome-public-datasets

A topic-centric list of HQ open datasets. Contribute to awesomedata/awesome-public-datasets development by creating an account on GitHub.

github.com

 

 

이건 데이터셋들이 git-hub에 저장되어있는 사이트입니다.


5. Google AI Datasets

https://ai.google/tools/#datasets

 

Tools – Google AI

At Google, we think the impact of AI will be most powerful when everyone can use it. Explore our tools.

ai.google

 


6. Google Dataset Search

https://toolbox.google.com/datasetsearch

 

Dataset Search

 

datasetsearch.research.google.com


7. SKT BigData Hub

https://www.bigdatahub.co.kr/index.do

 

SKT Data Hub

대한민국은 현재 코로나 19와 함께 맞서 싸우고 있습니다. 2020년 발생한 코로나 19사태! 어떠한 정보들이 있었는지 아래에서 확인해보세요!

www.bigdatahub.co.kr

 


8. Kaggle competition datasets

https://www.kaggle.com/datasets

 

Find Open Datasets and Machine Learning Projects | Kaggle

Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Flexible Data Ingestion.

www.kaggle.com


9. DACON

dacon.io/

 

데이터사이언티스트 AI 컴피티션

1만 AI팀이 협업하는 인공지능 플랫폼.

dacon.io

경진대회에서 제공되는 데이터셋을 다운받아 사용할 수 있다.


10. AI hub 

한국인이 만든 여러가지 데이터 셋이 있다.

대한민국 디지털 뉴딜 데이터 댐 만들기를 통해 만들어진 데이터

www.aihub.or.kr/sample_data_board/image

 

샘플 데이터 | AI Hub

국내 장소, 객체에 대한 인공지능 인식기술 개발 및 성능강화를 위해 한국형 사물이미지인 국가지정문화재, 국내 상품, 도시별 랜드마크 이미지 AI 데이터 개방

www.aihub.or.kr

반응형