📌 G-estimation: 인과추론의 숨은 강자 한 환자가 있다.1년 동안 병원에 여러 번 방문하면서→ 의사는 그때그때 건강 상태를 보고 약을 조절한다.→ 약을 먹으면 건강 상태도 달라진다. 이 말은,약이 건강에 영향을 주고,건강 상태는 다시 약을 결정짓는 기준이 된다. 즉, 건강 상태(혹은 검사 수치)가결과에도, 치료 결정에도 영향을 주는 변수인 것이다. 🌀 이걸 왜 단순하게 분석하면 안 될까? 단순히 “약을 먹은 사람 vs 안 먹은 사람” 비교하면 헷갈린다. 건강 상태가 나쁜 사람일수록 약을 더 많이 먹고,약은 건강을 개선하려 하니까,두 효과가 뒤엉켜서 약의 ‘진짜 효과’를 구분하기 어렵다. 🔥 바로 이런 상황에서 필요한 게 G-estimation이다 G-estimation은 이렇게 ..
⏱️ 반복측정자료가 왜 생존분석에서 중요한가? 현실 데이터에서는한 번의 측정으로 끝나지 않는다. 환자의 체중, 혈압, 혈당은 시간에 따라 달라진다복용 약물이나 증상 점수도 반복적으로 측정된다이 변화가 사망, 재발, 입원 같은 이벤트 발생과 밀접하게 연관되어 있다 그렇다면 단순히 baseline만 보는 건 한계가 있다. 📍 반복측정자료를 어떻게 반영하느냐에 따라,예측도, 추정도, 인사이트도 완전히 달라진다. 1️⃣ Time-dependent Cox PH: 값을 시간마다 갈아 끼운다 🔁 ✅ 개념Time-dependent Cox는기존 Cox 모델을 확장해,시간에 따라 바뀌는 변수값(X(t))을 반영할 수 있는 구조이다. 즉, 한 번 측정한 X 값이 아니라,매 시점마다 갱신되는 X(t)를 반영해해당 시..
🧬 반복측정자료는 어디에나 있다 실제 연구나 의료 데이터를 보면,단 한 번의 측정으로 모든 걸 설명하는 경우는 거의 없다. 예를 들어, 같은 환자의 혈압을 1개월, 3개월, 6개월째 추적한다면?치료 전과 치료 후, 반응이 달라지는지 본다면?매년 건강검진을 받는 코호트에서 수치가 어떻게 변할까? 이처럼 하나의 대상에게서 시간에 따라 여러 번 측정된 자료를우리는 반복측정자료(repeated measures)라고 부른다. 🤔 그런데 분석은 어떻게 해야 할까? 이런 데이터를 분석할 때, 단순히“모든 관측치를 일렬로 세워서 회귀분석을 하면 되지 않을까?”하고 생각할 수 있다. 하지만 여기서 문제가 생긴다…→ 📌 바로 독립성 가정의 붕괴이다! 🔍 왜 일반 회귀로는 부족할까? 일반 선형회귀나 GLM은 ..
🎯 인과추론, 도대체 뭐길래? “이 약이 효과가 있었을까?”“그 정책이 없었으면 어떻게 됐을까?” 이런 질문을 할 때, 우리가 진짜로 알고 싶은 건 ‘인과관계’입니다.단순히 함께 나타난다(correlation)가 아니라,👉 정말 ‘그것 때문에 그렇게 된 건지’ 알고 싶은 거죠! 🛠️ 인과추론이란? “어떤 개입(Treatment)이 결과(Outcome)에 영향을 줬는가?” 를 과학적으로 추정하는 방법 즉, “그랬다면 어땠을까?”(Counterfactual) 를 상상해서 비교하는 게 핵심입니다.예를 들어, 신약을 복용한 환자와 복용하지 않은 똑같은 조건의 환자를 비교해진짜 신약이 효과 있었는지 알아보는 거예요. 📦 인과추론 방법론 총정리! 🔍 방법💡 핵심 아이디어✅ 사용 조건🧪 예시📊 난이..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.