현대의학은 "얼마나 좋은가"를 수치로 말하는 과학이다.
신약이 기존 약보다 얼마나 효과적인지, 위험요인이 질병과 어떤 관련이 있는지 등을 판단하기 위해,
연구자들은 다음과 같은 지표들을 사용한다.
이번 글에서는 논문에서 자주 등장하는 9가지 대표 지표를 알기 쉽게 정리하고,
각 지표가 언제, 왜, 어떻게 쓰이는지 소개한다.
✅ 1. RR (Relative Risk, 상대위험비)
비유: 불 붙은 성냥을 들고 있는 사람이 화재를 낼 확률과 없는 사람의 확률을 비교하는 것
- 정의: 노출군의 질병 발생 위험이 비노출군보다 몇 배 높은지를 나타낸다.
- 계산:
- 해석:
- RR = 1.0 → 차이 없음
- RR > 1 → 위험 증가
- RR < 1 → 위험 감소
🧪 예시: 백신군 감염률 2%, 위약군 4% → RR = 0.5 → 백신은 감염 위험을 절반으로 줄였다.
📌 사용: 코호트 연구, 임상시험(RCT)
✅ 2. OR (Odds Ratio, 교차비)
비유: "당첨될 확률"이 아니라 "당첨/실패의 비율"을 비교하는 느낌
- 정의: 사건의 Odds(확률/비확률)의 비율
- 계산:
- 특징: 발생률이 낮을 때 RR과 유사하지만, 높을수록 OR이 과대평가됨
🧪 예시: 흡연자가 폐암에 걸릴 확률이 비흡연자의 3배 → OR = 3.0
📌 사용: 케이스-컨트롤 연구, 로지스틱 회귀 결과 해석
✅ 3. RD (Risk Difference, 위험 차)
비유: "두 집단의 감기 환자 수 차이"를 직접 세는 느낌
- 정의: 노출군과 비노출군 사이의 절대 위험 차이
- 계산:
🧪 예시: 신약군 감염률 2%, 위약군 5% → RD = -3% (3% 감소)
📌 사용: 치료로 얼마나 절대적인 효과를 주는지 판단할 때
✅ 4. NNT (Number Needed to Treat)
비유: "몇 명을 치료해야 1명을 구할 수 있는가?"
- 정의: 1건의 질병 발생을 예방하기 위해 필요한 치료 인원 수
- 계산:
- 특징: 작을수록 좋은 치료 (예: NNT = 5 → 5명 치료하면 1명 예방)
📌 사용: 의사결정에 실질적인 정보를 제공
✅ 5. IRR (Incidence Rate Ratio, 발생률 비)
비유: "시간당 사고가 얼마나 자주 발생하는지" 비교
- 정의: 시간 단위당 발생률을 비교한 비율
- 계산:
🧪 예시: 치료군 5건/100인년, 대조군 10건/100인년 → IRR = 0.5
📌 사용: 추적 시간이 다른 경우 (감염병, 재입원 등)
✅ 6. HR (Hazard Ratio, 위험비)
비유: "시간이 흐르면서 사건이 발생할 순간순간의 비율"
- 정의: 사건이 시간에 따라 얼마나 빨리 발생하는지를 비교
- 사용: Cox 비례위험모형에서 추정
- 해석: HR = 0.7 → 치료군은 사건 위험이 30% 감소
📌 사용: 생존 분석, 시간-사건 자료 (사망, 재발 등)
✅ 7. MD (Mean Difference, 평균 차이)
비유: 체중계 수치를 비교하는 것
- 정의: 두 집단의 평균값 차이
- 계산:
🧪 예시: 위약군 혈압 140, 치료군 130 → MD = -10 mmHg
📌 사용: 연속형 결과 변수 비교 (혈압, 콜레스테롤, HbA1c 등)
✅ 8. SMD (Standardized Mean Difference)
비유: "키 차이를 평균과 표준편차 기준으로 환산한 차이"
- 정의: 단위가 다른 변수 간 비교를 위해 표준화한 평균 차이
- 계산:
- 해석 기준:
- SMD < 0.1: 균형 양호
- 0.2~0.5: 중간 차이
- 0.8: 큰 차이
📌 사용: 성향점수 매칭(PSM) 후 균형 평가
✅ 9. IR (Incidence Rate, 발생률)
비유: "단위 시간당 사고 건수"
- 정의: 전체 person-time 대비 사건 수
- 계산:
🧪 예시: 10건/500인년 → IR = 0.02 (2%/년)
📌 사용: 추적 시간 불균등한 경우
🧭 정리 표
지표 | 비교 기준 | 해석 | 주요 사용 |
RR | 위험 비율 | 상대 효과 | 코호트, RCT |
OR | Odds 비율 | 상대 효과 | 케이스-컨트롤, 로지스틱 회귀 |
RD | 위험 차이 | 절대 효과 | 임상적 유용성 |
NNT | RD 역수 | 치료 효율성 | 임상결정 |
IR | 시간당 발생 | 사건 속도 | 감염, 재입원 |
IRR | IR 비율 | 상대속도 | 인년 단위 비교 |
HR | Hazard 비 | 시간-사건 | 생존 분석 |
MD | 평균 차이 | 양적 비교 | 연속 변수 |
SMD | 표준화 차이 | 균형 판단 | PSM 평가 |
✍️ 마무리
이 지표들은 단순한 숫자가 아니다.
논문의 결론이 신뢰할 수 있는지, 치료가 실제로 유의미한 효과를 주는지를 판단하는 과학적 언어이다.
특히 보건의료 데이터를 다루는 분석가나 기획자라면,
이 지표들을 읽을 줄 아는 것에서 그치지 않고, 직접 계산하고 시각화할 수 있어야 한다.
'데이터분석' 카테고리의 다른 글
🧠 결측값을 더 똑똑하게 다루는 법: MICE 완전 정복 (1) | 2025.05.22 |
---|---|
[데이터분석] 혼합효과모형(Mixed Effect Model) 완전 정복 (1) | 2025.05.16 |
[데이터분석] 반복측정(longitudinal) 데이터의 두 축: GEE vs GLMM (0) | 2025.05.16 |
[생존분석] RMST vs. AFT 모델 완전 정리 (2) | 2025.05.16 |
[데이터분석] 📚 결측치 처리와 인과추론, 함께 이해하기 (0) | 2025.04.26 |