Odds Ratio 계산 - Odds Ratio gyesan

Mail a PDF copy of this page to:

Save this email address on this device

(Your email address will not be added to a mailing list)

Other calculators ...

Free statistical calculators

Computational notes

The odds ratio (OR), its standard error and 95% confidence interval are calculated according to Altman, 1991.

The odds ratio is given by

Odds Ratio 계산 - Odds Ratio gyesan

with the standard error of the log odds ratio being

Odds Ratio 계산 - Odds Ratio gyesan

and 95% confidence interval

Odds Ratio 계산 - Odds Ratio gyesan

Where zeros cause problems with computation of the odds ratio or its standard error, 0.5 is added to all cells (a, b, c, d) (Pagano & Gauvreau, 2000; Deeks & Higgins, 2010).

Test of significance: the P-value is calculated according to Sheskin, 2004 (p. 542). A standard normal deviate (z-value) is calculated as ln(OR)/SE{ln(OR)}, and the P-value is the area of the normal distribution that falls outside ±z (see Values of the Normal distribution table).

Literature

How to cite this page

  • MedCalc Software Ltd. Odds ratio calculator. https://www.medcalc.org/calc/odds_ratio.php (Version 20.115; accessed October 13, 2022)

See also

  • MedCalc manual: Logistic regression
  • MedCalc manual: Relative risk & Odds ratio

Odds Ratio 계산 - Odds Ratio gyesan

An Introduction to Medical StatisticsMartin Bland

Buy from Amazon

This textbook is intended for medical researchers and includes the design of clinical trials and epidemiological studies, data collection, summarizing and presenting data, probability, standard error, confidence intervals and significance tests, techniques of data analysis including multifactorial methods and the choice of statistical method, problems of medical measurement and diagnosis, vital statistics, and calculation of sample size.

상대위험도와 승산비(RR, Relative Risk & OR, Odds Ratio)

상대위험도(RR)와 승산비(=오즈비, OR)는 범주형 자료(예: 위험인자에 노출된 사람과 그렇지 않은 사람에서 질환 발생 여부를 판단하는 자료) 분석에서 대상에 따라 질환의 발생 가능성을 확인하는 방법이다. 즉 위험인자와 질환 발생과의 연관성(예: 흡연과 폐암 발생에 연관성이 있는가)을 확인하는 것이다.

일반적으로 코호트 연구일 경우 상대위험도를, 환자대조군 연구일 경우 승산비를 활용해 계산한다. 

1) 상대위험도(RR)

상대위험도는 위험인자에 노출되었을 때 질병이 발생할 확률에서, 위험인자에 노출되지 않았을 때 질병이 발생할 확률을 나눈 값이다.

Odds Ratio 계산 - Odds Ratio gyesan

위 계산에서 나온 값은 ‘위험인자에 노출된 경우, 노출되지 않은 경우보다 질병에 걸릴 확률이 00배 높다’고 해석한다.

2) 승산비(OR)

승산비는 1) 위험인자에 노출된 사람 중 질병에 걸린 사람 수를 질병에 걸리지 않은 사람 수로 나누고, 이를 다시 2) 위험인자에 노출되지 않은 사람 중 질병에 걸린 사람 수를 질병에 걸리지 않은 사람 수로 나눈 값을 말한다. 

승산비는 흔히 오즈비라고도 표현하는데, 이 값은 ‘위험인자에 노출된 경우 노출되지 않은 경우에 비해 질환이 발생할 위험이 00배 더 크다’ 정도로 해석한다. 

3) 상대위험도(RR)와 승산비(OR)의 활용

코호트 연구의 경우 아직 질환이 발생되지 않은 모집단을 위험인자에 노출된 집단과 위험인자에 노출되지 않은 집단으로 구분하여 추적 관찰한다(시간적 개념이 포함됨). 그러므로 위험인자 노출 모집단과 비노출 모집단을 파악할 수 있고, 이에 따라 상대위험도를 통해 위험인자와 질병 발생 간의 연관성을 추정할 수 있다.

반면 환자-대조군 연구는 이미 질환이 발생한 환자군과 질환이 발생하지 않은 대조군을 모집한 후 위험인자 노출 여부(특정 시점에서의 결과)를 후향적으로 조사하여 위험인자와 질환 발생 간의 연관성을 추정한다. 이러한 경우에는 위험인자에 노출된 전체 모집단과 노출되지 않은 전체 모집단을 파악할 수가 없으므로(특정 시점에서의 집단 수만 파악할 수 있기 때문에) 승산비를 사용할 수밖에 없는 것이다.

Kicarussays

Statistics (R)

Odds ratio & Confidence interval 계산 방법

Kicarus 2021. 10. 22. 19:02

의료 데이터 연구에는 여러 가지가 있지만, 실험군과 대조군을 비교하여 가설을 검정하는 연구가 많이 수행됩니다.

그리고 실험군과 대조군에 대하여, 어떤 사건이 더 많이 발생하는지 설명할 때, Odds ratio가 많이 활용됩니다.

예를 들어, 아래와 같은 형태로 데이터가 추출되었다고 해봅시다.

    심혈관 질환 발생   심혈관 질환 미발생
  고혈압 환자   $a = 992$   $c = 2260$
  정상   $b = 165$   $d = 1017$

눈으로 봐도 확실히 고혈압 환자가 심혈관 질환이 더 많이 발생했지만, 이를 통계적으로 증명하는 데에 Odds ratio와 Odds ratio에 대한 신뢰구간을 활용해볼 것입니다.

Odds ratio의 계산식은 다음과 같습니다.

$$\frac{\frac{\text{고혈압 환자 with 심혈관 질환}}{\text{고혈압 환자 without 심혈관 질환}}}{\frac{\text{정상 with 심혈관 질환}}{\text{정상 without 심혈관 질환}}} = \frac{\frac{\text{고혈압 환자 with 심혈관 질환}}{\text{정상 with 심혈관 질환}}}{\frac{\text{고혈압 환자 without 심혈관 질환}}{\text{정상 without 심혈관 질환}}} = \frac{(992 / 165)}{(2260 / 1017)} = 2.71$$

해당 수치가 1보다 크면 고혈압 환자가 심혈관 질환 발생 위험이 더 큰 것입니다.

하지만 수치 자체로 보는 것으로는 충분하지 않고, 오즈비에 대한 신뢰구간이 1에서 벗어나 있어야 해당 유의수준 하에서 가설 (고혈압 환자가 심혈관 질환 발생 위험이 높다) 이 유의미하다고 볼 수 있습니다.


Odds ratio의 95%에 해당하는 신뢰구간을 구하는 방식은 다음과 같습니다.

$$e^{\left( \log(\text{OR}) \pm \left[ 1.96 \times \text{SE}(\log(\text{OR})) \right] \right)}$$

여기서 $\log(\text{OR})$의 SE(Standard Error)를 구하는 식은 다음과 같습니다.

$$\text{SE} (\log(\text{OR})) = \sqrt{\frac{1}{a} + \frac{1}{b} + \frac{1}{c} + \frac{1}{d}} = \sqrt{\frac{1}{992} + \frac{1}{165} + \frac{1}{2260} + \frac{1}{3277}}  = 0.092165$$

최종적으로 신뢰구간을 구해보면 다음과 같습니다.

$$e^{\log(\text{OR}) \pm 1.96 \times \text{SE}(\log(\text{OR}))} = (2.529, 2.890)$$

신뢰구간이 1을 포함하고 있지 않기 때문에, 고혈압 환자가 심혈관 질환 발생 위험이 유의미하게 높다고 결론내릴 수 있습니다.


다기관 의료데이터 연구를 수행할 때, 모든 데이터를 한 곳에 모아서 분석을 수행한다면 참 좋겠지만, 개인정보 이슈와 정책적인 한계로 각 기관 분석 결과를 토대로 전체 분석 결과를 유추해야 합니다. 하지만 기준에 해당하는 데이터의 개수(count)만 알고 있으면, 기관 별 데이터를 합쳐서 Odds ratio를 계산하는 것은 아주 쉽습니다 (물론 기관별 Random Effect를 고려해야 합니다). 이러한 장점이 있는 Odds ratio를 연구에서 활발히 사용해 볼 수 있을 것 같습니다.

참고자료: https://sphweb.bumc.bu.edu/otlt/MPH-Modules/PH717-QuantCore/PH717_ComparingFrequencies/PH717_ComparingFrequencies8.html

Confidence Interval for an Odds Ratio

Confidence Interval for an Odds Ratio Note that while we have discussed using the odds ratio as a measure of association in the context of a case-control study, odds ratios can also be computed in other types of study designs as well. Recall our example of

sphweb.bumc.bu.edu