― 이대로만 해도 ‘그나마’ 안 망한다 ― 데이터 분석을 하다 보면 이런 말 자주 듣습니다. “아 그거 결측 많아요. 그냥 평균으로 넣었어요.”“결측치 많아서 모델이 안 돌아가요.”“삭제했는데 성능 왜 이러죠?” 결측치는 분석가의 발목을 붙잡는 은근한 복병입니다.실제 업무에선 단순히 "채운다"나 "지운다"로는 해결 안 됩니다.결측이 왜 생겼고, 어떤 종류고, 무엇을 위해 다루는지에 따라전략이 완전히 달라져야 합니다. 1️⃣ 실무에서 마주치는 결측치, 이건 알아야 합니다 종류설명예시실무적 함의MCAR (Missing Completely at Random)완전히 무작위 결측설문 중 실수로 빠뜨림제거해도 영향 적음MAR (Missing at Random)특정 변수에 따라 결측 확률 다름나이 많은 응답자가 ..
머신러닝 데이터에서 학습하는 인공지능의 핵심 기술 목차 머신러닝 기본 개념 머신러닝의 유형 머신러닝 알고리즘 모델 평가 및 선택 머신러닝 파이프라인 머신러..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.