안녕하세요. 홍박사입니다. 이번 포스팅에는 표본공간, 사건 그리고 확률의 정의에 대해서 이야기해 보겠습니다. 초반부터 말씀드리겠습니다. 지금부터 확률 통계가 조금 어렵게 느껴지거나 거리감 있게 느껴질 수 있습니다. 어떤 분야든 기본 개념을 잡는 것이 가장 중요합니다. 물론 가장 지루하고 힘든 일입니다. 그냥 띄엄띄엄 이해하고 넘어갈 수도 있습니다. 그런다고 통계 분석을 못하는 것도 아닙니다. 하지만 통계의 재미를 느끼기 위해서는 이 지루함을 참아내셔야 합니다.
자 그럼 시작해 봅시다. 우리는 어떠한 대상의 특성을 파악하기 위해서 관찰하거나 또는 측정을 합니다. 이를 통해서 우리는 관찰값 또는 측정값을 얻을 수 있습니다. 이를 표본(sample)이라고 합니다. 이건 이전 포스팅에서 다루었던 것이라 간단하게 넘어가겠습니다.
[통계 노트/통계 개념 정리] - [개념 통계] 모집단과 표본이란 무엇인가?
이제 "표본 공간 (sample space)"이란 개념에 대해서 이야기 해봅시다. 표본 공간은 “어떤 특정 실험 또는 무작위 실험을 했을 때, 측정가능한 모든 결과들의 집합(the set of all possible outcomes or results of that experiment)”으로 정의합니다. 그렇다면 표본 공간(sample space)은 표본과 무엇이 다를까요? 표본 공간은 정의 그대로 “측정 가능한 모든 결과의 집합”을 말합니다. 따라서 표본 공간을 이루는 개개의 관찰 결과를 우리는 표본점(sample)이라고 합니다. 즉, 우리가 수집한 표본은 표본 공간의 부분집합이라고 할 수 있습니다.
예들 들어 봅시다. 만약 동전을 반복해서 두번 던지는 실험을 한다고 하면 표본 공간(S)은 아래 그림과 같습니다.
만약 주사위를 가지고 동일한 실험을 한다고 하면 표본 공간(S)은 아래 그림과 같습니다.
자, 이제 그러면 “사건(event)”이라는 개념으로 넘어가 봅시다. 확률통계에서 “사건”이란 표본공간의 부분집합으로 어떤 조건을 만족하는 특정한 표본점들의 집합을 말합니다. 설명이 조금 딱딱하지요? 조금 더 쉬운 말로 바꿔봅시다. 예컨대 주사위를 두 번 던져서 나온 각각의 수를 더했을 때 그 값이 “2”가 나올 때를 기다린다고(조건) 한다면, 여기서 “사건”이란 바로 첫번째도 "1"이 그리고 두번째도 "1"이 나왔을 때가 바로 사건이 발생한 때입니다. 굉장한 사건이지요.
자 이제 이러한 개념을 가지고 "확률(probability)"을 정의해봅시다. 확률이란 “동일한 조건 하에서 동일한 실험을 무수히 많이 반복하여 실시할 때, 어떤 특정한 사건이 발생하는 비율”을 말합니다. 수식으로 설명하면 다음과 같습니다.
지금까지 이야기한 표본, 표본공간, 사건의 개념을 가지고 확률을 설명하면 아래와 같습니다.
즉, 확률이란 [어떤 실험을 했을 때, 나올 수 있는 모든 경우의 수(표본 공간) 중 어떤 특정한 조건을 만족하는 사건이 발생하는 비율]을 말합니다. 확률이란 간단한 개념을 이렇게 장황하게 설명하려니 좀 머슥하군요.
도움이 되셨다면 공감하트 꾹 눌러주세요~!
'통계 노트 > 통계 개념 정리' 카테고리의 다른 글
[개념 통계 14] 정규분포와 표준정규분포 그리고 Z-score (1) | 2018.02.26 |
---|---|
[개념 통계 13] 확률 변수와 확률 함수 (13) | 2017.12.02 |
[개념 통계 11] 모집단과 표본이란 무엇인가? (13) | 2017.03.19 |
[개념 통계 10] 분산도란 무엇인가: 표준편차와 분산 (22) | 2017.01.19 |
[개념 통계 09] 분산도란 무엇인가: 범위, 사분 편차, 박스플롯 (11) | 2016.12.19 |