2 R 객체(R object)

학습목표(2 주차): R에서 사용 가능한 데이터 타입에 대해 알아보고, 고유 데이터 타입으로 구성한 객체(스칼라, 백터, 리스트)와 이와 연관된 함수들을 익힌다.

학습 필요성

  • R언어는 타 프로그래밍 언어와 유사한 데이터 타입(정수형, 실수형, 문자형 등)을 제공
  • R 언어가 다른 언어와 차이점 \(\rightarrow\) 데이터 분석에 특화된 벡터(vector), 행렬(matrix), 데이터프레임(data frame), 리스트(list)와 같은 객체7 제공
  • R 패키지에서 제공되는 함수 사용 방법은 R의 객체에 따라 달라질 수 있음
  • R 언어를 원활히 다룰 수 있으려면 R에서 데이터 객체의 형태, 자료 할당 및 그 연산 방법에 대한 이해가 필수적으로 선행되어야 함

R의 데이터 타입

  • 수치형(numeric): 숫자(정수, 소수)

  • 문자열(string): "충남대학교", "R강의"

  • 논리형(logical): TRUE/FALSE

  • 결측값(NA): 자료에서 발생한 결측 표현

  • 공백(NULL): 지정하지 않은 값

  • 요인(factor): 범주형 자료 표현(수치 + 문자 결합 형태로 이해하면 편함)

  • 기타: 숫자아님(NaN), 무한대(Inf) 등

R 객체의 종류

  • 스칼라(상수형, scalar 또는 atomic)
  • 벡터(vector): R의 기본연산 단위
  • 리스트(list)
  • 행렬(matrix)
  • 배열(array)
  • 데이터프레임(data frame)

아래 그림은 2~4 주차에 배울 R 주요 객체에 대한 개요도임

R 데이터 타입 구조 다이어그램: [R, Python 분석과 프로그래밍 (by R Friend)]( http://rfriend.tistory.com/)에서 발췌 후 수정

Figure 2.1: R 데이터 타입 구조 다이어그램: R, Python 분석과 프로그래밍 (by R Friend)에서 발췌 후 수정


  1. R에서 사용자가 데이터 입력을 위해 생성 또는 읽어온 객체(object)는 종종 변수(variable)라는 말과 혼용. 본 문서에서는 최상위 데이터 저장장소를 객체라고 명명하며 데이터프레임과 같이 여러 종류의 데이터타입으로 이루어진 객체의 1차원 속성을 변수라고 칭함