Acdong
Learn by doing
Acdong
전체 방문자
오늘
어제
  • 분류 전체보기
    • Economy
      • Saving Money
    • Self-improvement
    • Thoughts
    • Machine learning
      • Deep Learning
      • Chatbot
      • NLP
    • MLops
      • AWS
      • Container
      • Serving
    • Computer Vision
    • Data Science
      • ADsP
      • R
    • Project
    • Python
      • Data Structure & Algorithm
    • C,C++
    • API
      • ElasticSearch
    • Error Note
    • Network
    • RDBMS
      • SQL

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • [GitHub]

인기 글

태그

  • 머신러닝
  • 어텐션
  • 기계학습
  • 회귀계수
  • Numpy
  • nlp
  • 데이터 전처리
  • plot()
  • 이미지 전처리
  • pandas
  • c포인터
  • 존댓말 반말 분류
  • Python
  • SentenceTransformer
  • R
  • 다중공선성
  • sbert
  • R그래프
  • R시각화
  • 포인터

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Acdong

Learn by doing

Machine learning

[데이터 전처리]. tqdm pandas , apply & map progress_bar 생성

2021. 4. 15. 10:21
728x90

tqdm 은 for 문을 처리할때 

진행률을 표시해주는 파이썬 라이브러리이다.

 

하지만 pandas 에서 열전체의 함수를 매기는 map 이나 데이터프레임 전체에 함수를 매기는 apply 의 경우

많은 데이터의 실행을 했을 때 진행률을 알 수 없고

 

주피터에서 * 표시만 계속 쳐다볼뿐이다.

 

그래서 pandas 의 map 함수와 apply 함수의 진행률을 볼 수 있는 방법을 공유한다.

 

apply

import pandas as pd
import numpy as np
from tqdm import tqdm
# from tqdm.auto import tqdm  # for notebooks

df = pd.DataFrame(np.random.randint(0, int(1e8), (10000, 1000)))

# Create new `pandas` methods which use `tqdm` progress
# (can use tqdm_gui, optional kwargs, etc.)
tqdm.pandas()

# Now you can use `progress_apply` instead of `apply`
df.groupby(0).progress_apply(lambda x: x**2)

 

MAP

def sum_two(x):
	return x + 2
df['colName'] = df['colName'].progress_map(sum_two)

 

tqdm 4.8 버전 이하는 

from tqdm import tqdm, tqdm_pandas
tqdm_pandas(tqdm())

 

참고 : stackoverflow.com/questions/18603270/progress-indicator-during-pandas-operations

반응형
저작자표시 비영리 (새창열림)

'Machine learning' 카테고리의 다른 글

[설치]. 윈도우 하위 시스템 WSL 셋팅하기  (0) 2021.07.18
[설치]. 리눅스 환경에서 Anaconda 설치하기  (0) 2021.07.18
[기계 학습]. SGD 와 mini batch ( 최적화 기법 )  (0) 2021.03.22
[기계 학습] sklearn.pipeline 파이프 라인  (0) 2021.02.10
[데이터 전처리]. 날짜 데이터 전처리  (0) 2021.02.09
    'Machine learning' 카테고리의 다른 글
    • [설치]. 윈도우 하위 시스템 WSL 셋팅하기
    • [설치]. 리눅스 환경에서 Anaconda 설치하기
    • [기계 학습]. SGD 와 mini batch ( 최적화 기법 )
    • [기계 학습] sklearn.pipeline 파이프 라인
    Acdong
    Acdong
    E-mail : alswhddh@naver.com / 자연어처리와 MLops 를 연구하고 있는 스타트업 개발자입니다.

    티스토리툴바