[개념 통계 15] 정규분포의 확률 계산
안녕하세요. 홍박사입니다. 이번 포스팅에서는 정규분포를 이용해서 확률을 계산하는 방법을 다루어보겠습니다. 사실 이 부분은 고등학교 과정에서 대부분 다루는 부분이라 이해하기 쉬우실 것 입니다. 우리가 조사하고자 하는 대상 X(예: 수능시험 점수)가 모수값 (평균 μ, 표준편차 s)을 가지는 정규분포를 이룬다고 합시다. 조사 대상 X (수능시험 점수) 내에서 나올 수 있는 값 x(내 시험점수)가 범위 (a, b)에 속할 확률은 정규 분포 함수를 a에서 b까지 적분한 값, 즉 면적 값입니다.
그렇다면 어떻게 정규분포의 면적값을 계산할 수 있을까요? 간단합니다. 정규분포함수 f(x)를 a-b까지 적분을 하면 됩니다. 그런데 이전 포스팅에서도 말씀드린 것처럼 조사 대상마다 서로다른 정규분포를 가지고 있기때문에 매번 확률을 계산하는 것이 번거롭게 됩니다. 따라서 표준정규분포로 변환한 후 확률을 계산하는 방법을 많이 사용합니다. 범위 (a, b)를 표준정규분포의 Z값으로 어떻게 변환할 수 있을까요? 다시한번 복습하면, Z값은 개별 값(내 점수)에 모집단의 평균(전국 수능 평균점수)을 뺀 값 (즉, 내 점수와 전국 수능 평균점수의 차이값)을 모집단의 표준편차(전국 수능 점수 표준편차)로 나누어주면 됩니다. 아래 그림에서 보는 것과 같이 정규분포 a, b범위의 면적과 a, b 값을 Z값으로 치환하여 표준정규분포에서 계산한 면적은 동일합니다.
우리가 표준정규분포의 면적을 일일이 적분 계산하는 것이 번거롭기 때문에, 표준정규분포에서 Z값에 따른 확률을 미리 계산해 놓은 표를 표준정규분포표라고 합니다. 정확히 말하면 표준정규분포표는 아래 그림에서 볼 수 있듯이 Z'값 이하가 될 확률을 미리 계산해 놓은 표입니다.
그렇다면 표준정규분포표는 어떻게 사용할까요? 예를 들어 봅시다. 만약 표준정규분포표를 이용해서 Z값이 1.36이하로 나타날 확률 (Z≤1.36)을 알고 싶다면 어떻게 해야할 까요? 아래 표의 행에서 1.36과 가장 가까운 1.3을 찾습니다. 그리고 열에서 0.06을 찾고, 두 행과 열이 만나는 지점의 값을 찾습니다. 즉 0.9131이 우리가 찾는 확률값이라고 할 수 있습니다.
도움이 되셨다면 공감하트 꾹 눌러주세요~!