Guts !!
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 49회차 미션 본문
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 49회차 미션
버블스텝 2020. 12. 6. 23:49[ 파이썬 의 필수 스킬 - 머신러닝 ] - 종합 정리 (3)
- 결측치 처리 Categorical 컬럼 데이터에 대한 결측치 처리

오늘의 포스팅은 결측치 처리에 대한 이야기를 다룰 것입니다. 저번 시간에는 숫자형 데이터에 대한 결측치를 처리를
하였습니다. 잠깐 복습을 하자면..

info()함수를 사용해서 결측치를 알아도 처리 할 수 있지만 또한 isnull().sum() 함수를 이용해서 몇개인지 파악을 할 수 있었습니다.

이후 fillna()함수를 이용해서 빈 컬럼을 지정하고 값을 구할 수가 있었습니다. 또한

위에 처럼 fillna를 할때 평균값을 이용해서 값을 채워 넣을 수가 있었고 2개 이상의 컬럼을 지정을 하고 싶다면

사이킷런에 SimpleImputer를 이용해서 값을 넣어주는 방식을 했습니다.
그렇다면 오늘은 Categorical Column의 결측치 처리를 어떻게 할까???

첫번째는 이전과 같이 fillna()를 사용해서 값을 넣어주는 것입니다. 일단 넣어주기전에 먼저 할 것은 info() 함수를 통해 컬럼의 타입이 int 인치 chr 인지를 확인을 먼저 해야 합니다.
그렇다면 두개 이상의 컬럼을 지정을 하고 싶다면?? 이때 사용되는 것이 simpleImputer입니다.

이전의 숫자형 결측치에는 strategy에는 mean 값 이였지만 문자형은 평균이라는 개념이 없으니까 "most_frequent" 입니다.

결론을 보면 결측치가 살아 졌다는 것을 볼 수 있다.
오늘의 포스팅은 여기 까지 입니다.
해당 강의 이미지 링크
'FastCampus[직장인] 위한 파이썬(미션)' 카테고리의 다른 글
| 패스트캠퍼스 직장인을 위한 파이썬 데이터 분석 챌린지 참여 후기 (0) | 2020.12.27 |
|---|---|
| [패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 50회차 미션 (0) | 2020.12.07 |
| [패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 48회차 미션 (0) | 2020.12.05 |
| [패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 47회차 미션 (0) | 2020.12.04 |
| [패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 46회차 미션 (0) | 2020.12.03 |
