[개념 통계 04] 통계의 시작: 척도의 종류
안녕하세요. 홍박사입니다. 이번 포스팅에서는 척도에 대해서 살펴보겠습니다. 척도(Scale)는 어떠한 대상의 특성을 단위를 사용하여 정량화한 것을 말합니다. 쉽게 말하면 척도는 대상 특성의 "단위"라고 해도 크게 무방합니다. 이전 포스팅에서 살펴보았듯이 자료는 범주형(Categorical/Qualitative) 자료와 연속형 (Numerical/quantitative) 자료로 구분할 수 있습니다. 척도도 역시 "범주형 자료"와 "연속형 자료"에 따라 명목척도, 순위척도, 등간척도, 비율척도 이렇게 네 가지로 구분할 수 있습니다.
범주형 자료를 나타내는 척도로는 명목 척도(nominal scale)와 순위척도 (ordinal scale)가 있습니다.
명목 척도 (nominal scale): 말 그대로 이름뿐인 척도
▲ 명목척도는 이름 또는 범주를 나타내는 척도입니다.
명목척도는 영어로 nominal scale이라고 합니다. nominal의 사전적 의미는 "이름뿐인" 입니다. 따라서 명목 척도는 말 그대로 이름 뿐인 척도 또는 단위 입니다. 무슨 말이냐고요? 명목 척도의 예를 보시면 쉽게 이해하실 수 있을 겁니다. 대표적인 명목 척도의 예로 성별(남/여) 국적(한국, 일본, 중국 등), 직업(회사원, 공무원, 자영업 등), 거주 지역(서울, 경기, 강원 등)가 있습니다. 많은 분들이 토익(Toeic) 시험 답안지에 여러가지 명목 척도를 사용한 설문지를 작성해 본 경험이 있을 겁니다. 예를 들어
수험생의 학력은 어떻게 되십니까?
1. 중졸 이하, 2. 고졸, 3. 대졸, 4. 대학원 졸
라는 설문 문항은 명목 척도를 이용해서 여려분의 학력 정보를 구분하는 것 입니다. 학력에 대한 4가지 카테고리를 제시하고 선택하게 하였습니다. 각 카테고리마다 1부터 4까지 선택하게 하였지만 1-4 숫자는 숫자로써의 의미보다는 구분으로써의 의미를 가지고 있습니다. 다시 한번 강조하자면 명목 척도는 숫자로 표현될 수 있지만 수량적인 의미를 갖지 않고, 범주(카테고리)를 구분하는 용도로 쓰이는 척도 입니다.
순위 척도 (ordinal scale): 관찰대상이 지니는 속성에 따라 순위를 결정하는 척도
▲ QS 세계 대학 순위 역시 순위척도 입니다. 명심해야할 것은 세계 1등 대학이 6등보다 6배 좋은 대학이라고 할 수 없다는 것입니다.
순위 척도는 말 그대로 순위를 나타내는 척도 입니다. 영어로는 ordinal scale입니다. 영어 order는 순서라는 뜻이지요? 대표적인 순위 척도는 학교 석차입니다. 학교 석차는 내가 취득한 시험 점수를 기준으로 내 성적이 전체 학생들 중에서 몇 번째 위치하고 있는 지를 나타내는 순위 척도인 것입니다. 올림픽 금메달, 은메달, 동메달도 마찬가지로 순위척도 입니다. 즉, 순위척도란 관찰대상이 지닌 속성에 따라 순위를 결정하는 척도라고 할 수 있습니다.
그렇다면 우리는 순위 간 간격이 같다고 할 수 있을까요? 같은 질문을 더 쉽게 해보겠습니다. 전교 1등과 3등의 성적 차이는 4등과 6등간의 성적 차이와 같을까요? 정답은 당연히 아닙니다. 순위척도는 단순히 순서를 매기는 척도이기 때문입니다. 근소한 차이로 1등과 2등이 갈릴 수 도 있구요. 아주 큰 차이로 금메달과 은메달이 갈릴 수 있는 것 입니다. 이는 또한 전교 1등이 전교 100등보다 공부를 100배 잘한다고 할 수 없는 것과 같은 맥락입니다. 즉, 순위 척도는 어떠한 속성에 대한 우열에 대해서 판단을 할 수는 있지만 이것은 단순한 순위일뿐이라는 점을 명심하셔야 합니다.
연속형 자료를 나타내는 척도로는 등간 척도 (Interval scale)와 비율 척도 (ratio scale)이 있습니다.
등간 척도 (interval scale): 속성을 평가할 수 있는 균일한 간격을 두고 측정하는 척도
▲ 섭씨온도는 절대 영점이 없는 등간 척도입니다.
등간 척도(interval scale)는 관측 대상이 지닌 속성의 차이를 양적인 차이로 측정하기 위하여 척도간 간격을 균일하게 분할하여 측정하는 척도입니다. 척도의 간격을 균일하게 나누어 사용하게 되면 관측 대상의 속성을 정량적으로 측정할 수 있을 뿐만 아니라 사칙 연산을 수행하여 비교할 수 있습니다. 대표적인 등간 척도로는 섭씨 온도 (temperature), 리커트 척도(Likert scale) 등이 있습니다.
등간 척도의 특징은 해당 속성이 없는 절대 영점(Absolute zero)가 없다는 것 입니다. 그런데 섭씨 온도는 0이 있는데 등간 척도라니요? 섭씨 온도의 0은 물이 어는 점을 0으로 기준 삼은 것 뿐이지 온도가 없다는 뜻이 아닙니다. 따라서 섭씨 온도는 등간 척도라고 할 수 있습니다.
비율 척도 (ratio scale): 절대 영점이 있는 등간 척도
▲ 무게는 절대 영점이 있는 비율 척도 입니다.
비율 척도 (ratio scale)은 서열성, 등간성, 비율성의 세 속성을 모두 가진 척도를 말합니다. 예컨대 거리, 무게, 시간 등이 대표적인 비율 척도라고 할 수 있습니다. 앞에 예를 든 모든 척도는 모두 절대 영점이 있습니다. 거리가 없을 수 있구요. 무게도 없을 수 있습니다. 즉 비율 척도는 절대 영점이 있는 등간 척도라고 볼 수 있습니다. 따라서 사칙연산 (* / - +)이 모두 가능하고 평균을 내는 것도 가능합니다.
지금까지 살펴본 네 가지 척도의 특징을 요약하면 아래 그림과 같습니다.
통계 데이터를 제대로 다루기 위해서는 이번 포스팅에서 설명한 척도의 의미와 처리 방식에 대해서 숙지해야 합니다. 왜냐하면 척도의 종류에 따라서 데이터 처리 방식이 서로 다르기 때문입니다. 예컨대 범주를 나타내는 명목 척도와 순위 척도를 가지고 평균을 내어서는 안됩니다. 아무런 의미를 가지고 있지 않습니다. 범주형 척도는 빈도수(frequency)를 이용해서 정량화하는 방법을 택해야 합니다.
반면에 연속형 척도인 등간 척도와 비율 척도는 사칙 연산이 가능하기 때문에 평균값과 편차값을 계산하여 통계 처리를 할 수 있습니다. 이러한 차이는 앞으로 다루게될 통계 기법과 매우 밀접하게 관련되어 있다는 것을 차차 알아 가게 되실 것 입니다.
도움이 되셨다면 공감하트 꾹 눌러주세요~!