신뢰구간(CI; confidence interval)
: 단순히 표본의 평균이 아닌, 실제 모집단 참값*을 포함하는 범위를 알고 싶을 때 일반적으로 사용됨.
*참값(true value) : 모집단 전체에 대한 자료를 가지고 있는 경우에 알 수 있는 평균값
예를 들어 고혈압치료제오 인한 혈압 강하 효과에 대한 논문이 있다고 해보자.
실제 논문에 참여한 집단에서 평균 혈압의 변화를 계산할 수는 있지만, 만약 또 다른 집단을 모집하여 그 평균 혈압 변화를 구한다면 정확히 같은 값을 가질 것이라고 기대할 수 없을 것이다. 왜냐하면 혈압의 변화에 영향을 주는 다양한 변수가 있기 때문이다.
신뢰 구간은 참값(논문에 참여한 집단의 수를 무한대로 가져갈 때의 평균혈압의 변화)이 있을 것 같은 범위를 제시한다.
A연구 | N =100, basal SBP = 170 mmHg → Drug → 평균혈압의 변화 = 20 mmHg 95% CI = 15~25 ▷ 실제 치료효과가 95% 신뢰도로 혈압을 15-25 mmHg 만큼 낮춤. |
B연구 | N =50, basal SBP = 170 mmHg → Drug → 평균혈압의 변화 = 20 mmHg 95% CI =-5~45 ▷ 신뢰구간이 0(변화없음)을 포함하며, 실제 환자 중에서 5% 이상은 혈압의 변화가 없는 경우가 존재함 ▷ 약효 효과 X |
결론적으로 95% CI를 통해 변수 X에 대한 효과가 임상적으로 유의한 효과인지 판단하기 위해서는 범위에 0이 포함되서는 안 된다.
신뢰구간의 크기는 표본크기 및 개별 결과의 변동성과 관련이 있다.
1) 큰 연구일수록 대체로 좁은 신뢰구간을 가짐
2) 메타분석(meta-analysis)은 여러 개의 유사한 연구들로부터 연구 효과에 대한 하나의 전체 예상치를 나타낼 수 있는 방법
whats' 메타분석?
- 2개 이상의 일차 연구들을 fixed-effects or random-effects model을 이용하여 통계적으로 분석한 것
이때, fixed와 random의 차이는 다음과 같다.
50명의 선생님들을 새로운 수학 커리큘럼 연구에 등록하고 25명은 새 커리큘럼으로 나머지 25명은 이전의 커리큘럼으로 무작위로 나뉘어 수업을 진행한다. 이 때 학생의 시험 점수에 대한 커리큘럼의 효과를 평가하고자 한다.
여기에는 2 개 이상의 가능성과 2 개 이상의 가정이 있다.
Possible scenarios | |
Among these 50 teachers and no others, what is the effect of the 2 curricula on student examination scores? 교사의 차이가 아닌 2개의 커리큘럼이 학생 시험 점수에 미치는 영향은 무엇인가? |
Among all teachers who might ever teach this course, of whom these 50 are a random sample, what is the impact of the 2 curricula on examination scores? 50명의 교사가(무작위 표본으로 어떤 커리큘럼을 가르치게 될 지 결정된) 2개의 커리큘럼에 영향을 미치어 학생들의 시험 점수에 어떠한 영향을 미치는가? |
Assumption | |
new vs old 커리큘럼의 효과는 모든 교사들에게 동일하다. |
new vs old 커리큘럼의 효과는 모든 교사들에게 동일하지 않다. |
Fixed-effects model (Combined estimate) | Random-effects model |
- 이 모델은 통계적 접근법의 차이가 있다 Inverse variance Mantel-Haenszel method Peto odds ratio - 접근법 선택의 차이에 따라 현저한 결과 차이가 발생할 수 있다. |
- Inverse variance 또는 Mantel-Haenszel method을 이용하여 연구에 가중치를 둘 수 있다. - 가장 흔히 이용하는 방법은 다음과 같다. DerSimonian method Laird method |
- 연구 간 variability는 고려하지 않는다. - 오직 연구 내 variability만을 고려한다. - This model aims to estimate this common truth effect and the uncertainty about it. |
- 이 모델은 포함된 모든 연구의 집단이 무작위 표본이라고 가정한다. 필연적으로 연구간의 환자, 개입(intervention), 결과의 차이의 차이가 존재하기 때문이다. - 연구 결과가 개입만의 효과라고 여기지 않는다. - 연구 간/ 연구 내 variability를 모두 고려한다. |
- estimates effect in this sample of studies. - assumes effects are the same in all studies. |
- estimates effect in a population of studies from which the available studies are a random sample. - assumes effects differ across studies and the pooled estimate is the mean effect. |
Narrow CI large studies have much more weight than small studies. |
Wider CI large studies have much more weight than small studies, but the gradient is smaller than in fixed-effect models. (작은 연구에서 도출된 결과치가 귀무 결과(null result)에서 더 벗어나는 경우, 이 모델에서 더 유익하거나 유해한 효과의 추정치를 산출할 것이다. = 더 과대평가되어 총 결과에 영향을 미칠 것이다.) |
예-1. Villanueva, Cristina M., et al. "Meta-analysis of studies on individual consumption of chlorinated drinking water and bladder cancer." Journal of Epidemiology & Community Health 57.3 (2003): 166-173.
위의 그림을 통해 가장 큰 weight 변화를 보여주는 연구는 King 1996이다.
신뢰구간이 비교적인 넓은 Koivusala 1998과 McGeehin1993은 환자수가 적었을 것으로 예상할 수 있다.
Case-control studies | Study population |
Cantor et al 1998 | 732 cases 914 population controls |
Koivusalo et al 1998 | 1123 cases 1983 population controls |
King et al 1996 | 696 cases 1545 population controls |
McGeehin et al 1993 | 327 cases 261 other cancer sites controls |
Cantor et al 1987 | 2855 cases 5258 population controls |
Cohort studies | |
Wilkins and Comstock 1981 |
31000 study subjects, 81 bladder cancer cases |
예-2. Bande, Manuel F., et al. "Intravitreal injections of anti-VEGF agents and antibiotic prophylaxis for endophthalmitis: a systematic review and meta-analysis." Scientific reports 7.1 (2017): 1-6.
메타 분석을 해석할 때,
(1) 어떤 연구에서 가장 큰 변화를 보여주는지
(2) 모든 연구에서 중재법이 favor(유리한) 변화를 보여주는지
(3) 어떤 model을 이용하여 결과를 도출하였는지
등을 검토해볼 수 있겠다.
reference :
(1) 알기 쉬운 의학 통계, 3판
(2) 네이버 두산백과
(3) slideplayer.com/slide/17389355/
'🍓 의학통계·논문' 카테고리의 다른 글
논문의 질 평가하기 : SCI급 논문, impact factor(IF) (0) | 2022.09.02 |
---|---|
의학 통계 : p값 (0) | 2020.10.07 |
의학 통계 : 표준편차 (0) | 2020.09.06 |
의학 통계 : 대푯값 ; 평균(mean), 중위수(median), 최빈값(mode) (1) | 2020.09.06 |
의학 통계 : 백분율 (0) | 2020.09.06 |
댓글