본문 바로가기

통계 노트/통계 개념 정리

[개념 통계 19] 1종 오류와 2종 오류란 무엇인가

안녕하세요. 이번 포스팅에서는 통계적 오류에 대해서 이야기해 보겠습니다. 우리는 수집한 데이터를 바탕으로 어떠한 사안에 대해서 결정을 합니다. 하지만 우리가 항상 옳은 결정을 하는 것은 아닙니다. 우리가 수집한 자료는 모집단에서 추출한 표본이기 때문에 항상 오류의 가능성이 존재하기 때문입니다. 따라서 우리가 어떤 의사 결정을 할 때에는 발생할 수 있는 오류를 최소화해야 합니다. 통계적 검정을 할 때에도 마찬가지입니다. 우리가 통계적 가설검정을 할 때에도 발생할 수 있는 통계적 오류를 최소화 해야 옳은 판단을 할 확률을 높일 수 있습니다. 가설검정에 대한 내용은 다음 포스팅을 참고해주시면 됩니다.  ([통계 노트/통계 개념 정리] - [개념 통계] 귀무가설과 대립가설이란 무엇인가?)

 

그렇다면 통계적 오류에는 어떤 것이 있을까요? 통계적 오류에는 1종 오류와 2종 오류 이렇게 두 가지 종류의 오류가 있습니다. 통계 수업을 들어보신 분이라면 한 번쯤을 들어보셨을 것입니다. 우선 1종 오류와 2종 오류의 사전적 정의는 다음과 같습니다.

 

  • 1종 오류 (Type I error): 귀무가설(H0)가 실제로는 참이어서 채택해야 함에도 불구하고 표본의 오차때문에 이를 채택하지 않는 오류를 말합니다. 보통 α (알파)로 표기하고 유의수준이라고 부릅니다.
  • 2종 오류 (Type II error): 귀무가설(H0)가 거짓이라서 채택하지 말아야 하는데 표본의 오차 때문에 이를 채택하는 오류를 말합니다. 보통 β (베타)로 표기합니다. 

이 개념을 간단히 정리하면 아래 표와 같이 정리할 수 있습니다. 그런데 이 통계 오류의 개념이 글로는 쉬워 보여도, 막상 설명하려고 하면 헷갈리는 면이 많이 있습니다. 왜냐하면 각 오류의 정의가 너무 추상적이어서 실제 연구에서 나타날 수 있는 오류와 개념적으로 연결이 잘 되지 않기 때문입니다.

 

자, 그래서 이 두 가지 통계적 오류의 개념을 조금 더 쉽고 와닿게 설명해 보도록 하겠습니다. 어느 제약회사에서 연구자가 신약을 개발하고 있다고 가정해봅시다. 신약의 효과를 검증하기 위해 임상 실험을 진행하였고 그 결과를 바탕으로 신약이 효과가 정말 있는지 여부를 판단한다고 합시다. 귀무가설(H0)은 개발한 "신약은 효과가 없다"입니다. 그렇다면 여기서 1종 오류와 2종 오류는 어떻게 표현될 수 있을까요?

 

 

여기서 1종 오류는 실제로 신약이 "효과가 없음"에도 불구하고 "효과가 있다"고 판단하는 경우입니다.

그리고 2종 오류는 실제로 신약이 "효과가 있음"에도 불구하고 "효과가 없다"고 판단하는 경우입니다.

 

이제 두 통계적 오류의 정의가 어떻게 다른지 조금 더 이해가 되시나요? 자 그럼 도대체 왜 이 두 가지 오류가 의사 결정에 어떠한 영향을 주게 될까요? 위의 표를 보고 조금 더 생각해 봅시다. 

 

  • 먼저 실제로 신약이 효과가 없는 상황을 생각해 봅시다. 가장 바람직한 의사 결정은 신약이 효과가 없다고 판단하는, 즉 귀무가설을 채택하는 것입니다. 그러면 계속 연구를 진행하여 평상업무를 보면 됩니다. 그런데 1종 오류가 발생하면 어떻게 될까요? 다시 말해 실제로 신약이 효과가 없는데 효과가 있다고 판단하는 경우 (즉, 귀무가설을 기각하고 대립가설을 채택하는 경우)에는 어떤 일이 벌어질까요? 회사는 개발한 신약을 큰 돈을 들여 생산하고 시장에 출시할 것이고 이는 회사에게 막대한 금전적 피해를 끼치는 것과 더불어 시장에서의 신뢰를 잃게 되는 결과를 초래할 것입니다. 
  • 그럼 실제로 신약이 효과가 있는 상황을 생각해봅시다. 옳은 의사 결정은 신약이 효과가 있다고 판단하는, 즉 귀무가설을 기각하고 대립가설을 채택하는 것입니다. 그러면 회사는 큰 수익을 창출할 것이고 연구자는 그에 따른 표창과 포상을 받을 것입니다. 그런데 2종 오류가 발생하면 어떻게 될까요? 다시 말해 실제로 신약이 효과가 있음에도 효과가 없다고 판단하는 경우에는 연구자에게 어떤 일이 벌어질까요? 연구자는 아마 계속 신약 연구를 진행할 것이고, 당연히 신약이 출시 안되었기 때문에 기업이 수익을 창출하지 못하게 되겠죠. 

옳은 의사결정을 위해서는1종 2종 오류 모두 최소화하는 연구를 진행해야할 것입니다. 그런데 연구자에게 어떤 통계 오류가 더 위험할까요? 저는 1종 오류라고 생각합니다. 왜냐하면 신약이 효과가 없는데 신약이 효과가 있다고 판단하는 경우 (1종 오류) 회사에게 더욱 큰 피해를 끼칠 수 있을 뿐만 아니라 그 약을 사용하는 환자들에게도 큰 피해를 줄 수 있기 때문입니다. 이로 인해 연구자는 심한 경우 연구자는 회사에서 해고될 수도 있을 것 입니다.

 

반면에 신약이 효과가 있는데 없다고 판단한 경우 (2종 오류)는 회사에게 어느 정도 경제적 피해를 줄 수는 있겠지만 연구자가 회사에서 해고될 정도의 피해를 주지는 않을 것입니다. 추후의 연구를 통해 신약의 효과를 면밀하게 검정하면 되기 때문이죠. 따라서 연구자들은 1종 오류를 줄이는 방향으로 실험에 대한 결과를 해석하고 판단합니다. 

 

통계 가설 검정시 1종 오류를 1% 또는 5% 이내로 보통 설정하는데 이것이 바로 그 유명한 유의 수준(significance level)입니다. 그렇다면 2종 오류는 가설 검정의 어떤 개념과 연관되어 있을까요? 바로 검정력 입니다. 우리는 처치의 효과(신약의 효과)가 있을때 이를 제대로 확인할 수 있는 확률을 이를 검정력(Statistical power)이라고 정의합니다. 검정력은 1에서 2종 오류가 발생할 확률을 뺀 1-β로 표현될 수 있습니다. 다음 포시팅에서는 유의 수준과 검정력에 대해서 좀 더 자세히 다뤄보도록 하겠습니다. 

 

도움이 되셨다면 공감하트를 꾹 눌러주세요~!