🍓 의학통계·논문

의학 통계 : 대푯값 ; 평균(mean), 중위수(median), 최빈값(mode)

기미개미 2020. 9. 6.

오늘은 의학통계에서 빼놓을 수 없는 평균★, 중위수, 최빈값☆을 배워보도록 하겠다!

평균(mean)  자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값
중위수(median) 자료를 크기 순으로 나열했을 때 한가운데에 위치하는 자료값
  자료가 홀수 개- 정중앙 값
  자료가 짝수 개- 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균
최빈값(mode)  자료 중 빈도수가 가장 높은 자료값

 

각 값들을 해석할 때 주의 사항

1) 평균 mean

하나의 값 혹은 여러 값이 다른 값에 비해 너무 작거나 커서 자료가 치우쳐 있을 경우

< 예 >

자료 값 평균
10, 11, 12, 13, 14, 14 12.33
10, 10, 10, 11, 11, 22 12.33

 

이런 경우에는 평균보다는 중위수를 대푯값으로 사용하는 것이 더 합리적이다.

2) 중위수 median

 

위의 그림처럼 자료의 분포가 비대칭적인 분포형태를 보일 때, mean값보다는 median값을 대푯값으로 사용하는 것이 바람직하다.

이 값을 표현할 때는 사분범위(IQR; inter-quartile range)와 함께 주어지는 경우가 있다.

 

- 1st quartile(제1사분위수) = 25th percentile : 전체 자료의 1/4 아래 있을 때의 지점

- 3rd quartile(제3사분위수) = 75th percentile : 전체 자료의 3/4 아래 있을 때의 지점

- 제1사분위수~제3사분위수 사이의 범위를 사분범위;IQR이라고 한다. IQR을 보면서 자료 값들이 얼마나 멀리 퍼져있는지, 어느 쪽(upper or lower)으로 치우쳐 있는지 파악할 수 있다.

3) 최빈값 mode

가장 자주 발생하는 사건에 대한 표시가 필요할 때 사용되며 드물게 사용되는 값이다.

 

 

reference :

(1) 알기쉬운 의학통계, 3판

(2) www.statistics4u.com/fundstat_eng/cc_iqr.html

(3) towardsdatascience.com/forecast-kpi-rmse-mae-mape-bias-cdc5703d242d

 

댓글