본문 바로가기

통계 노트/통계 개념 정리

[개념 통계 15] 정규분포의 확률 계산


안녕하세요. 홍박사입니다. 이번 포스팅에서는 정규분포를 이용해서 확률을 계산하는 방법을 다루어보겠습니다. 사실 이 부분은 고등학교 과정에서 대부분 다루는 부분이라 이해하기 쉬우실 것 입니다. 우리가 조사하고자 하는 대상 X(예: 수능시험 점수)가 모수값 (평균 μ, 표준편차 s)을 가지는 정규분포를 이룬다고 합시다. 조사 대상 X (수능시험 점수) 내에서 나올 수 있는 값 x(내 시험점수)가 범위 (a, b)에 속할 확률은 정규 분포 함수를 a에서 b까지 적분한 값, 즉 면적 값입니다. 



그렇다면 어떻게 정규분포의 면적값을 계산할 수 있을까요? 간단합니다. 정규분포함수 f(x)를 a-b까지 적분을 하면 됩니다. 그런데 이전 포스팅에서도 말씀드린 것처럼 조사 대상마다 서로다른 정규분포를 가지고 있기때문에 매번 확률을 계산하는 것이 번거롭게 됩니다. 따라서 표준정규분포로 변환한 후 확률을 계산하는 방법을 많이 사용합니다. 범위 (a, b)를 표준정규분포의 Z값으로 어떻게 변환할 수 있을까요? 다시한번 복습하면, Z값은 개별 값(내 점수)에 모집단의 평균(전국 수능 평균점수)을 뺀 값 (즉, 내 점수와 전국 수능 평균점수의 차이값)을 모집단의 표준편차(전국 수능 점수 표준편차)로 나누어주면 됩니다. 아래 그림에서 보는 것과 같이 정규분포 a, b범위의 면적과 a, b 값을 Z값으로 치환하여 표준정규분포에서 계산한 면적은 동일합니다. 




우리가 표준정규분포의 면적을 일일이 적분 계산하는 것이 번거롭기 때문에, 표준정규분포에서 Z값에 따른 확률을 미리 계산해 놓은 표를 표준정규분포표라고 합니다. 정확히 말하면 표준정규분포표는 아래 그림에서 볼 수 있듯이 Z'값 이하가 될 확률을 미리 계산해 놓은 표입니다.



그렇다면 표준정규분포표는 어떻게 사용할까요? 예를 들어 봅시다. 만약 표준정규분포표를 이용해서 Z값이 1.36이하로 나타날 확률 (Z1.36)을 알고 싶다면 어떻게 해야할 까요? 아래 표의 행에서 1.36과 가장 가까운 1.3을 찾습니다. 그리고 열에서 0.06을 찾고, 두 행과 열이 만나는 지점의 값을 찾습니다. 즉 0.9131이 우리가 찾는 확률값이라고 할 수 있습니다. 



도움이 되셨다면 공감하트 꾹 눌러주세요~!