오늘은 의학통계에서 빼놓을 수 없는 평균★★★, 중위수★★★, 최빈값☆을 배워보도록 하겠다!
평균(mean) | 자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값 |
중위수(median) | 자료를 크기 순으로 나열했을 때 한가운데에 위치하는 자료값 자료가 홀수 개- 정중앙 값 자료가 짝수 개- 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균 |
최빈값(mode) | 자료 중 빈도수가 가장 높은 자료값 |
각 값들을 해석할 때 주의 사항
1) 평균 mean
하나의 값 혹은 여러 값이 다른 값에 비해 너무 작거나 커서 자료가 치우쳐 있을 경우
< 예 >
자료 값 | 평균 |
10, 11, 12, 13, 14, 14 | 12.33 |
10, 10, 10, 11, 11, 22 | 12.33 |
이런 경우에는 평균보다는 중위수를 대푯값으로 사용하는 것이 더 합리적이다.
2) 중위수 median
위의 그림처럼 자료의 분포가 비대칭적인 분포형태를 보일 때, mean값보다는 median값을 대푯값으로 사용하는 것이 바람직하다.
이 값을 표현할 때는 사분범위(IQR; inter-quartile range)와 함께 주어지는 경우가 있다.
- 1st quartile(제1사분위수) = 25th percentile : 전체 자료의 1/4 아래 있을 때의 지점
- 3rd quartile(제3사분위수) = 75th percentile : 전체 자료의 3/4 아래 있을 때의 지점
- 제1사분위수~제3사분위수 사이의 범위를 사분범위;IQR이라고 한다. IQR을 보면서 자료 값들이 얼마나 멀리 퍼져있는지, 어느 쪽(upper or lower)으로 치우쳐 있는지 파악할 수 있다.
3) 최빈값 mode
가장 자주 발생하는 사건에 대한 표시가 필요할 때 사용되며 드물게 사용되는 값이다.
reference :
(1) 알기쉬운 의학통계, 3판
(2) www.statistics4u.com/fundstat_eng/cc_iqr.html
(3) towardsdatascience.com/forecast-kpi-rmse-mae-mape-bias-cdc5703d242d
'🍓 의학통계·논문' 카테고리의 다른 글
논문의 질 평가하기 : SCI급 논문, impact factor(IF) (0) | 2022.09.02 |
---|---|
의학 통계 : p값 (0) | 2020.10.07 |
의학 통계 : 신뢰구간 , 메타분석 fixed-effects or random-effects model (0) | 2020.09.06 |
의학 통계 : 표준편차 (0) | 2020.09.06 |
의학 통계 : 백분율 (0) | 2020.09.06 |
댓글