본문 바로가기

통계 노트/통계 개념 정리

(21)
[개념 통계 21] 가설 검정 방법과 원리 안녕하세요. 홍박사입니다. 이번 포스팅에서는 가설 검정을 하는 방법에 대해서 이야기해보도록 하겠습니다. 지금까지 가설 검정하는 방법을 이해하기 위해 앞 선 포스팅에서 "귀무가설/대립가설", "1종 오류 2종 오류", "유의수준" 이렇게 세 가지 개념을 다뤘습니다. 자 이제 이 세 가지 개념을 이해하고 가설 검정하는 순서에 대해서 설명해 보겠습니다. ● 1단계: 귀무가설 H0과 대립가설 H1을 설정합니다. 광고의 효과에 대한 가설을 예로들어봅니다. 귀무가설은 "광고 전과 후의 평균 상품 판매량에는 차이가 없을 것이다."가 될 것이고, 대립가설은 "광고 전과 후의 평균 상품 판매량에는 차이가 있을 것이다."가 될 것입니다. ● 2단계: 유의수준 α를 정합니다. 다음으로 귀무가설을 기각하거나 채택할 유의수준 ..
[개념 통계 20] 유의 수준이란 무엇인가? 안녕하세요. 홍박사입니다. 이번 포스팅에서는 추리 통계에서 가장 중요한 개념인 유의 수준과 가설 검정에 대해서 이야기 해보겠습니다. 먼저 이전 포스팅에서 다룬 통계적 가설 (귀무가설과 대립가설)의 개념을 대해서 다시 상기해 봅시다. 자세한 내용은 다음 포스팅을 살펴봐 주십시오. ([통계 노트/통계 개념 정리] - [개념 통계] 귀무가설과 대립가설이란 무엇인가?) 우리는 연구를 하거나 조사를 할 때 가설을 세우고 > 표본을 수집하여 > 그 가설을 검정합니다. 통계학에서 가설이란 모집단의 모수(예: 모평균)에 대한 잠정적인 주장 또는 가정을 말합니다. 가설 검정시 우리는 귀무가설 (Null hypothesis, H0)와 대립가설 (Alternative hypothesis, H1)을 설정합니다. 귀무가설(또는..
[개념 통계 19] 1종 오류와 2종 오류란 무엇인가 안녕하세요. 이번 포스팅에서는 통계적 오류에 대해서 이야기해 보겠습니다. 우리는 수집한 데이터를 바탕으로 어떠한 사안에 대해서 결정을 합니다. 하지만 우리가 항상 옳은 결정을 하는 것은 아닙니다. 우리가 수집한 자료는 모집단에서 추출한 표본이기 때문에 항상 오류의 가능성이 존재하기 때문입니다. 따라서 우리가 어떤 의사 결정을 할 때에는 발생할 수 있는 오류를 최소화해야 합니다. 통계적 검정을 할 때에도 마찬가지입니다. 우리가 통계적 가설검정을 할 때에도 발생할 수 있는 통계적 오류를 최소화 해야 옳은 판단을 할 확률을 높일 수 있습니다. 가설검정에 대한 내용은 다음 포스팅을 참고해주시면 됩니다. ([통계 노트/통계 개념 정리] - [개념 통계] 귀무가설과 대립가설이란 무엇인가?) 그렇다면 통계적 오류에는..
[개념 통계 18] 귀무가설과 대립가설이란 무엇인가? 안녕하세요 홍박사입니다. 이번 포스팅에서는 통계적 가설검정에 대해서 다루어 볼 겁니다. 우선 가설을 어떻게 정의할 수 있을까요? [진실이라고 확증할 수는 없지만 "아마도 그럴 것이다." 라는 잠정적인 주장]을 가설이라고 말할 수 있을 것 같습니다. 연구자들은 연구하고자 하는 대상이 나타내는 현상을 관찰한 후에, 그 현상을 설명하는 가설을 설정합니다. 그리고 그 가설(Hypothesis)을 통계적인 방식으로 검정(Testing)합니다. 우리는 이를 통계적 가설검정(Hypothesis testing)이라고 부릅니다. 우리가 일반적으로 생각하는 가설은 아마 다음과 같은 것이 아닐까요. "지구는 둥글 것이다." 또는 "태양이 지구를 돌 것이다." 하지만 통계적 가설 검정은 어떠한 큰 이론을 제안하는 가설이 아닙..
[개념 통계 17] 중심극한 정리는 무엇이고 왜 중요한가? 안녕하세요. 홍박사입니다. 정말 오랜만에 포스팅을 합니다. 바쁘다는 핑계로 계속 포스팅을 미뤄오다가 마음을 다잡고 짧은 호흡으로라도 포스팅을 하는 것이 좋을 것 같다는 생각이 들었습니다. 부족한 글이지만 지금까지 이전 포스팅을 읽어주신 분들에게 감사드립니다. 이번 포스팅에서는 중심극한정리(Central Limit Theorem)가 무엇이고, 또 그것이 왜 중요한지에 대해서 말씀드리려고 합니다. 중심극한정리는 많이 들어보셨을 것입니다. 간략하게 중심극한정리를 설명하면 아래와 같습니다. 모집단이 「평균이 μ이고 표준편차가 σ인 임의의 분포」을 이룬다고 할 때, 이 모집단으로부터 추출된 표본의 「표본의 크기 n이 충분히 크다」면 표본 평균들이 이루는 분포는 「평균이 μ 이고 표준편차가σ/√n인 정규분포」에 근..
[개념 통계 16] 모집단분포와 표본분포란 무엇인가? 안녕하세요. 홍박사입니다. 이전 포스팅에서는 정규분포가 무엇인지 그리고 정규분포를 이용해서 사건이 일어날 확률을 계산하는 법을 다루었습니다. 이번 포스팅에서는 모집단 분포와 표본 분포에 대한 개념을 다루어 보려고 합니다. 추리 통계에 들어가기 전에 모집단과 표본이 무엇인지 그리고 그 둘은 무엇이 다른지 명확하게 이해해야 합니다. 이번 포스팅은 이전 포스팅: [통계 노트/통계 개념 정리] - [개념 통계] 모집단과 표본이란 무엇인가? 와 많은 내용이 중복됩니다. 참고하시길 바랍니다.^^ 모집단은 영어로 "인구"라는 의미의 "Population"입니다. 그렇다고 모집단을 일반적 의미의 "인구"라고 이해하시면 안됩니다. 모집단이란 "어떤 통계적 실험의 대상이 되는 모든 대상물"로 정의할 수 있습니다. 하. 말..
[개념 통계 15] 정규분포의 확률 계산 안녕하세요. 홍박사입니다. 이번 포스팅에서는 정규분포를 이용해서 확률을 계산하는 방법을 다루어보겠습니다. 사실 이 부분은 고등학교 과정에서 대부분 다루는 부분이라 이해하기 쉬우실 것 입니다. 우리가 조사하고자 하는 대상 X(예: 수능시험 점수)가 모수값 (평균 μ, 표준편차 s)을 가지는 정규분포를 이룬다고 합시다. 조사 대상 X (수능시험 점수) 내에서 나올 수 있는 값 x(내 시험점수)가 범위 (a, b)에 속할 확률은 정규 분포 함수를 a에서 b까지 적분한 값, 즉 면적 값입니다. 그렇다면 어떻게 정규분포의 면적값을 계산할 수 있을까요? 간단합니다. 정규분포함수 f(x)를 a-b까지 적분을 하면 됩니다. 그런데 이전 포스팅에서도 말씀드린 것처럼 조사 대상마다 서로다른 정규분포를 가지고 있기때문에 매..
[개념 통계 14] 정규분포와 표준정규분포 그리고 Z-score 안녕하세요. 홍박사입니다. 이전 포스팅에서는 확률변수와 확률함수에 대해서 다루었습니다. 확률변수란 특정확률로 나타나는 어떠한 사건에 수치를 부여한 변수라고 할 수 있고, 확률 함수란 확률 변수를 확률 값으로 대응시키는 함수를 말합니다. 이 확률변수와 확률함수를 이용하면 특정 사건이 일어날 확률을 계산할 수 있습니다. 그리고 그것을 도식화한 것이 바로 확률 분포입니다. 이번 포스팅에서는 통계에서 가장 많이 쓰이는 확률분포인 정규분포(Normal distribution)에 대해서 알아보도록 하겠습니다. 정규분포는 우리 주변에서 일반적(Normal)으로 발견되는 좌우대칭의 종 모양(Bell curve)으로 생긴 분포입니다. 때론 가우스분포라고도 부르기도 합니다. 우리 주변의 많은 변수 또는 자료들이 정규분포를..