1 Introduction
1. R프로그램
- 데이터 분석을 위한 자료 전처리, 통계 및 시각화를 지원하는 컴퓨터 언어 및 환경
- 1980년 AT&T 벨 연구소의 John Chambers가 개발한 S 언어를 기반으로 1995년 뉴질랜드 Auckland 대학의 통계학과 교수 Robert Gentleman과 Ross Ihaka 가 개발
- GNU 기반의 오픈 소스
- 통계학, 전산학, 생물학, 의학 등 거의 모든 학문분야에서 분석도구로 활용되고 있고, 최근 data science 분야에서 널리 활용
2. R 언어의 특징
- 무료 소프트웨어
- CRAN (Comprehensive R Archive Network)에서 배포
- 특정 vendor가 아닌 전 세계 연구자들이 개발한 알고리즘 및 최신 함수 활용 가능(packaging system)
- 범용적으로 사용되는 거의 대부분의 운영체제(Windows, Mac, Linux)에서 작동 가능
- 방대한 개발 및 사용 생태계 형성
- 강력한 그래픽 기능
유용한 웹 사이트: R과 관련한 거의 모든 문제는 Googling (구글을 이용한 검색)을 통해 해결 가능(검색주제 + “in R” or “in R software”)하고 많은 해답들이 아래 열거한 웹 페이지에 게시되어 있음.
- R 프로그래밍에 대한 Q&A: Stack Overflow
- R 관련 웹 문서 모음: Rpubs
- R package에 대한 raw source code 제공: Github
- R을 이용한 통계 분석: Statistical tools for high-throughput data analysis (STHDA)