본문 바로가기

통계 노트

(27)
[개념 통계 07] 도수 분포표와 히스토그램 안녕하세요. 홍박사입니다. 이전 포스트에서는 기술 통계와 추리 통계가 무엇인지 이야기 해보았습니다. 다시 한번 간단하게 요약하자면 기술 통계는 우리가 수집한 데이터가 어떻게 생겼는지 (대표값은 무엇인지? 어떻게 분포하고 있는지?)를 파악하는데 사용하는 통계 기법이라고 할 수 있고, 추리 통계는 그 수집한 데이터를 이용해서 우리가 예측하고 싶어하는 것을 확률적으로 판단하는 통계 기법들이라고 할 수 있습니다. ● [통계 노트/통계 개념 정리] - [개념 통계] 기술 통계와 추리 통계란 무엇인가? 이번 포스팅에는 기술 통계 기법 중에서 하나인 도수 분포표(frequency table)와 히스토그램(histogram)에 대해서 알아보겠습니다. 도수 분포표와 히스토그램은 중고등학교 과정을 무사히 마치셨다면 매우 ..
[개념 통계 06] 기술 통계와 추리 통계란 무엇인가? 안녕하세요. 홍박사입니다. 통계는 데이터를 다루는 목적에 따라 크게 두 가지로 구분할 수 있습니다. 하나는 기술 통계 (Descriptive Statistics) 그리고 다른 하나는 추리 통계 (Inferential statistics)로 말입니다. 기술 통계 (Descriptive statistics): 수집한 데이터를 요약 묘사 설명하는 통계 기법 기술 통계에서 "기술"은 영어로 Descriptive 입니다. 한국말로는 "묘사하는" 또는 "그려서 설명하는"이라는 뜻입니다. (여기서 "기술"을 "테크놀로지"라고 생각하시면 안됩니다!) 즉, 기술 통계는 우리가 수집한 데이터를 묘사하고 설명하는 통계 기법들을 말합니다. 그렇다면 기술 통계에는 어떤 것들이 있을까요? 다시 말해 수집한 데이터를 설명하는 통계..
[R 통계] 작업폴더 (Working directory) 설정하기 안녕하세요. 홍박사입니다. 이번 포스팅에서는 R에서 워킹 디렉토리(Working directory)를 설정하는 방법에 대해서 알아보겠습니다. 워킹 디렉토리란? 워킹 디렉토리는 말그대로 작업 폴더입니다. 워킹 디렉토리는 데이터를 불러오거나 외부로 저장하는 작업을 수행하는 기본 폴더입니다. 물론 워킹 디렉토리가 아닌 곳에서 데이터를 불러올 수 있지만 기본적으로 워킹 디렉토리를 통해서 불러오는 것이 편리합니다. 기본적으로 R 작업 중 생성되는 script, data set이 워킹 디렉토리에 저장됩니다. 따라서 R 분석을 할 때 가장 먼저 해야하는 일은 현재 작업공간을 설정하는 일입니다. 현재 설정된 워킹 디렉토리 확인하기: getwd() R에서 현재 워킹 디렉토리를 확인하려면 getwd() 명령어를 이용하면 ..
[SPSS] 그룹별 선그래프 그리기 안녕하세요. 홍박사입니다. 이번 포스팅에서는 SPSS로 그룹별 선그래프를 그리는 방법을 이야기해보겠습니다. SPSS는 가장 많이 쓰이는 통계 프로그램입니다. IBM이 인수하여 요즘은 IBM SPSS로 불립니다. SPSS는 Statistical Package for the Social Sciences의 줆말 입니다. 실제로도 공학분야 보다는 사회과학하시는 분들이 많이 쓰는 프로그램입니다. SPSS의 장점은 쉬운 그래픽 인터페이스 (GUI)입니다. 클릭 몇번으로 어려운 통계분석과 그래프를 순식간에 그릴 수 있습니다. 엑셀로 그리려면 30분 걸릴 그래프를 SPSS를 이용하면 1분도 안되서 완성할 수 있습니다. 하지만 그래프의 퀄리티가 좋지가 않다는 매우 큰 단점이 있습니다. 따라서 SPSS로 그린 그래프를 논..
[R 통계] 패키지 설치 및 로딩하기 안녕하세요. 홍박사입니다. 오늘은 R에서 패키지를 설치 및 로딩하는 방법을 포스팅하겠습니다. 너무 간단한 것이지만 간단한 것일수록 짚고 넘어가야겠죠. 우선 저는 R-studio를 설치했습니다. R-studio는 R 사용을 쉽게 도와주는 무료 프로그램입니다. 설치는 간단하니 링크를 따라가서 설치하시면 됩니다. R에는 다양한 패키지(package)들이 있습니다. R은 SPSS와 같은 상업용 통계 프로그램처럼 처음부터 패키지가 설치되어 있는 것이 아닙니다. 따라서 사용자가 패키지를 직접 설치해야 합니다. 명령어로 패키지 설치하는 방법 install.packages("ggplot2") R-studio로 패키지 설치하는 방법 우측하단 "Packages" 클릭 >> Install 클릭 >> Install Packa..
[개념 통계 05] 독립변수와 종속변수는 무엇인가? 안녕하세요. 홍박사입니다. 오늘은 변수와 관련해 마지막 포스팅을 해보려고 합니다. 오늘 다룰 변수는 독립변수와 종속변수입니다. 사실상 독립변수와 종속변수는 중고등학교 과학 시간에도 많이 들어본 개념일 것입니다. 이 두 변수는 통계분석을 하거나 또는 실험을 계획할 때 반드시 알고 있어야하는 변수입니다. 독립변수는 연구자가 의도적으로 변화시키는 변수를 말합니다. 독립변수는 영어로 Independent variable입니다. 말 그대로 독립적인 변수입니다. 통계에서 독립적이라는 말은 다른 변수에 영향을 받지 않는다는 뜻입니다. 따라서 독립변수는 다른 변수에 영향을 받지 않습니다. 오히려 종속 변수에 영향을 주는 변수 입니다. 종속변수는 연구자가 독립변수의 변화에 따라 어떻게 변하는지 알고 싶어하는 변수를 말합..
[R 통계] R 설치하기 안녕하세요 홍박사입니다. 통계 분석을 위한 프로그램이 여러가지가 있습니다. 대표적으로 많이 사용하는 통계 프로그램은 SPSS나 SAS 그리고 R을 많이 사용합니다. 그런데 SPSS와 SAS는 상업용 프로그램입니다. 한마디로 돈을 내야 사용할 수 있는 통계 프로그램입니다. 반면에 R은 무료 입니다. SPSS와 SAS는 돈을 주고 사서 쓰는 프로그램이다 보니 당연히 사용하기 편리합니다. GUI 기반의 프로그램이라 틀릭 몇 번으로 어려운 통계 분석을 할 수 있습니다. 하지만 R은 무료다 보니 사용하는 것이 어렵습니다. R을 쓰기 위해서는 코딩을 직접해야합니다. 그래서 어렵습니다. 사실상 저도 잘 못 씁니다. 이번에 난양공대 NTU 전기전자 공학과에서는 제가 한국에서 자주 사용하던 SPSS 라이센스를 제공하고 ..
[개념 통계 04] 통계의 시작: 척도의 종류 안녕하세요. 홍박사입니다. 이번 포스팅에서는 척도에 대해서 살펴보겠습니다. 척도(Scale)는 어떠한 대상의 특성을 단위를 사용하여 정량화한 것을 말합니다. 쉽게 말하면 척도는 대상 특성의 "단위"라고 해도 크게 무방합니다. 이전 포스팅에서 살펴보았듯이 자료는 범주형(Categorical/Qualitative) 자료와 연속형 (Numerical/quantitative) 자료로 구분할 수 있습니다. 척도도 역시 "범주형 자료"와 "연속형 자료"에 따라 명목척도, 순위척도, 등간척도, 비율척도 이렇게 네 가지로 구분할 수 있습니다. 범주형 자료를 나타내는 척도로는 명목 척도(nominal scale)와 순위척도 (ordinal scale)가 있습니다. 명목 척도 (nominal scale): 말 그대로 이름..