결측치처리

    [데이터 전처리] . 결측치 처리하기 ( Missing Values )

    데이터가 없을 때 할 수 있는 전략 데이터가 없으면 없는 행을 날려버린다. ( 간단하쥬 ) 데이터가 없는 최소 개수를 정해서 날려버린다. ( ex 결측치가 3개이상인 행은 날려버린다.) 데이터가 거의 없는 변수는 변수자체를 날려버린다. 최빈값, 평균값 , 중앙값으로 비어있는 데이터를 채운다. 머신러닝기법으로 예측해서 채워넣는다 ( 이 부분은 추 후에 다루도록 하겠습니다. ) 샘플데이터 결측치를 확인하는 방법 df.isnull().sum() first_name 칼럼에 1개 , last_name 칼럼에 1개 등등... 결측치가 있다. 첫 번째 방법. 결측치가 하나로 있으면 그 행을 날려버리기. dropna() : 결측치가 있는 행은 삭제해주는 함수 df_no_missing = df.dropna() df_no..