🍓 의학통계·논문

의학 통계 : 신뢰구간 , 메타분석 fixed-effects or random-effects model

기미개미 2020. 9. 6.

신뢰구간(CI; confidence interval)

: 단순히 표본의 평균이 아닌, 실제 모집단 참값*을 포함하는 범위를 알고 싶을 때 일반적으로 사용됨.

*참값(true value) : 모집단 전체에 대한 자료를 가지고 있는 경우에 알 수 있는 평균값

 

 

네이버 두산 백과

 

예를 들어 고혈압치료제오 인한 혈압 강하 효과에 대한 논문이 있다고 해보자.

실제 논문에 참여한 집단에서 평균 혈압의 변화를 계산할 수는 있지만, 만약 또 다른 집단을 모집하여 그 평균 혈압 변화를 구한다면 정확히 같은 값을 가질 것이라고 기대할 수 없을 것이다. 왜냐하면 혈압의 변화에 영향을 주는 다양한 변수가 있기 때문이다. 

신뢰 구간은 참값(논문에 참여한 집단의 수를 무한대로 가져갈 때의 평균혈압의 변화)이 있을 것 같은 범위를 제시한다.

 

A연구 N =100, basal SBP = 170 mmHg → Drug → 평균혈압의 변화 = 20 mmHg 95% CI = 15~25
▷ 실제 치료효과가 95% 신뢰도로 혈압을 15-25 mmHg 만큼 낮춤.
B연구 N =50, basal SBP = 170 mmHg → Drug → 평균혈압의 변화 = 20 mmHg 95% CI =-5~45
 신뢰구간이 0(변화없음)을 포함하며, 실제 환자 중에서 5% 이상은 혈압의 변화가 없는 경우가 존재함
 약효 효과 X

결론적으로 95% CI를 통해 변수 X에 대한 효과가 임상적으로 유의한 효과인지 판단하기 위해서는 범위에 0이 포함되서는 안 된다.

 

 

신뢰구간의 크기는 표본크기 및 개별 결과의 변동성과 관련이 있다. 

1) 큰 연구일수록 대체로 좁은 신뢰구간을 가짐

2) 메타분석(meta-analysis)은 여러 개의 유사한 연구들로부터 연구 효과에 대한 하나의 전체 예상치를 나타낼 수 있는 방법

 

whats'  메타분석?

- 2개 이상의 일차 연구들을 fixed-effects or random-effects model을 이용하여 통계적으로 분석한 것

 

이때, fixed와 random의 차이는 다음과 같다.

 

50명의 선생님들을 새로운 수학 커리큘럼 연구에 등록하고 25명은 새 커리큘럼으로 나머지 25명은 이전의 커리큘럼으로 무작위로 나뉘어 수업을 진행한다. 이 때 학생의 시험 점수에 대한 커리큘럼의 효과를 평가하고자 한다.

여기에는 2 개 이상의 가능성과 2 개 이상의 가정이 있다.

Possible scenarios
Among these 50 teachers and no others,
what is the effect of the 2 curricula on student
examination scores?
교사의 차이가 아닌 2개의 커리큘럼이
학생 시험 점수에 미치는 영향은 무엇인가?
Among all teachers who might ever teach this course,
of whom these 50 are a random sample,
what is the impact of the 2 curricula
on examination scores?
50명의 교사가(무작위 표본으로 어떤 커리큘럼을
가르치게 될 지 결정된) 2개의 커리큘럼에 영향을
미치어 학생들의 시험 점수에 어떠한 영향을 미치는가?
Assumption
new vs old 커리큘럼의 효과는 모든 교사들에게
동일하다.
new vs old 커리큘럼의 효과는 모든 교사들에게
동일하지 않다.
Fixed-effects model (Combined estimate) Random-effects model
- 이 모델은 통계적 접근법의 차이가 있다
  Inverse variance
  Mantel-Haenszel method
  Peto odds ratio
- 접근법 선택의 차이에 따라 현저한
결과 차이가 발생할 수 있다.
- Inverse variance 또는 Mantel-Haenszel method을
이용하여 연구에 가중치를 둘 수 있다.
- 가장 흔히 이용하는 방법은 다음과 같다.
 DerSimonian method
 Laird method
- 연구 간 variability는 고려하지 않는다.
- 오직 연구 내 variability만을 고려한다.
- This model aims to estimate this common 
truth effect and the uncertainty about it.
-  이 모델은 포함된 모든 연구의 집단이 무작위
표본이라고 가정한다. 필연적으로 연구간의 환자,
개입(intervention), 결과의 차이의 차이가
존재하기 때문이다.
- 연구 결과가 개입만의 효과라고 여기지 않는다.
- 연구 간/ 연구 내 variability를 모두 고려한다.
- estimates effect in this sample of studies.
- assumes effects are the same in all studies.
- estimates effect in a population of studies
from which the available studies are a random sample.
- assumes effects differ across studies
and the pooled estimate is the mean effect.
Narrow CI 
large studies have much more weight than small studies.
Wider CI
large studies have much more weight
than small studies, but the gradient is smaller
than in fixed-effect models.
(작은 연구에서 도출된 결과치가
귀무 결과(null result)에서 더 벗어나는 경우,
이 모델에서 더 유익하거나 유해한 효과의
추정치를 산출할 것이다.
= 더 과대평가되어 총 결과에 영향을 미칠 것이다.)

 

 

 

 

예-1. Villanueva, Cristina M., et al. "Meta-analysis of studies on individual consumption of chlorinated drinking water and bladder cancer." Journal of Epidemiology & Community Health 57.3 (2003): 166-173.

Odds ratios (OR), 95% confidence intervals (95% CI), study weight in the meta-analysis and combined risk estimate from meta-analysis of case-control studies on bladder cancer and long term consumption of chlorinated drinking water.

위의 그림을 통해 가장 큰 weight 변화를 보여주는 연구는 King 1996이다.

신뢰구간이 비교적인 넓은 Koivusala 1998과 McGeehin1993은 환자수가 적었을 것으로 예상할 수 있다.

 

Case-control studies Study population
Cantor et al 1998 732 cases 914 population controls
Koivusalo et al 1998 1123 cases 1983 population controls
King et al 1996 696 cases 1545 population controls
McGeehin et al 1993 327 cases 261 other cancer sites controls
Cantor et al 1987 2855 cases 5258 population controls
Cohort studies  
Wilkins and Comstock 1981
31000 study subjects, 81 bladder cancer cases

 

 

예-2. Bande, Manuel F., et al. "Intravitreal injections of anti-VEGF agents and antibiotic prophylaxis for endophthalmitis: a systematic review and meta-analysis." Scientific reports 7.1 (2017): 1-6.

 

 

 

 

메타 분석을 해석할 때,

(1) 어떤 연구에서 가장 큰 변화를 보여주는지

(2) 모든 연구에서 중재법이 favor(유리한) 변화를 보여주는지

(3) 어떤 model을 이용하여 결과를 도출하였는지

등을 검토해볼 수 있겠다.

 

 

reference : 

(1) 알기 쉬운 의학 통계, 3판

(2) 네이버 두산백과

(3) slideplayer.com/slide/17389355/

 

댓글