본문 바로가기

통계 노트/R 통계 공부

[R 통계] 데이터 프레임 열 편집하기


저는 R로 전향한지 얼마 되지 않았습니다. R을 쓸 때 익숙하지 않아서 가장 힘든 것이 바로 데이터 편집입니다. 어떤 데이터를 분석할 때 가장 시간이 많이 드는 부분은 통계 분석이나 그래프 그릴 때가 아니라 "데이터를 분석하기 좋게 편집할 때"입니다. 그래서 이번 포스팅부터 R에서 데이터 편집하는 방법을 정리해 보려고 합니다. 데이터 형식 중에서 우리가 가장 많이 쓰는 데이터 프레임(data frame)을 쓰도록 하겠습니다. 데이터 프레임 형식은 우리에게 익숙한 엑셀시트 형식이라고 보시면 됩니다. 이 포스팅에 사용된 예는 R graphics Cookbook 15장: 데이터 틀 잡기를 많이 참고하였습니다.


데이터 프레임에 열 추가하기: 데이터프레임$열이름 <-값


#데이터프레임 불러오기

install.packages("gcookbook") #gcookbook 설치하기

library(gcookbook) #gcookbook 불러오기

str (heightweight) #heightweight 데이터프레임 구조 살펴보기


#데이터 프레임에 새로운 열 추가하기 

heightweight$newcol <- NA #heightweight에 newcol을 추가하고 NA값을 넣기

str (heightweight) #heightweight 데이터프레임 추가된 열 확인하기



데이터 프레임에 열 삭제하기: subset(데이터프레임, select=-열이름) 


#데이터프레임에 기존에 있는 열 삭제하기 

heightweight <- subset(heightweight, select = -newcol) #heightweight에 newcol을 제외하기

str(heightweight)#heightweight 데이터프레임 삭제된 열 확인하기



도움이 되셨다면 공감하트 꾹 눌러주세요~!