특징 추출 및 결합1 Feature Engineering 피처엔지니링 피처 엔지니어링은 기존에 raw데이터를 분석가가 모델이 학습할 수 있는 정보로 바꾸는 과정을 말합니다. 모델이 학습하는 정보를 만드는데에 있어서, 분석가가 가진 도메인지식이나 다양한 통찰력이 적용될 수 있습니다. 모든 경우에 만능인 피처 엔지니어링 방법은 존재하지 않으며, 모든 경우에 누가 분석하느냐에 따라 달라질 수 있습니다. 데이터에서 효과적으로 정보를 추출하는 기법인 피처 엔지니어링은 머신러닝의 성능을 좌우하는 중요한 역할을 합니다. 1 피처엔지니어링 기법 1.1 Imputation(결측치 처리) 결측치: 머신러닝 모델 성능에 영향을 준다. 70% 이상의 결측치가 있는 행과 열은 지워주는 것도 좋다. Numerical Imputation: 결측치를 0이나 중앙값으로 대체 Categori.. 2021. 7. 7. 이전 1 다음