데이터전처리

Python

[Python] 데이터 전처리 하기 / 결측치, 중복 데이터, 이상치, 정규화, 원-핫 인코딩, 구간화

관세청 수출입 무역 통계 데이터를 사용하여 데이터 전처리를 해보았다. 먼저 데이터를 준비한다. 데이터를 가지고 무언가를 하기 전에 데이터의 대한 기본 정보부터 알아야 한다. 해당 데이터에서 금액은 단위가 천 불(USD 1,000)이며 무역수지는 '수출금액 - 수입금액'이다. > 결측치 (Missing Data) 중복된 데이터 이상치 (Outlier) 정규화(Normalization) 원-핫 인코딩 (One-Hot Encoding) 구간화 (Binning)

토오오끼
'데이터전처리' 태그의 글 목록