Course Overview

본 문서는 2020년도 1학기 정보통계학과에서 개설한 “통계 프로그래밍 언어” 강의를 위해 개발한 강의 노트이고 주 단위로 업데이트될 예정임. 본 강의 노트는 https://zorba78.github.io/cnu-r-programming-lecture-note/ 에서 확인할 수 있고, 해당 페이지에서 pdf 파일 다운로드가 가능함. 본 문서는 Yihui Xie가 개발한 bookdown 패키지 (Xie 2016)를 활용하여 생성한 문서이고 Google Chrome 또는 Firefox 브라우저에 최적화 됨. 아울러 충남대학교 정보통계학과 이상인 교수님의 2019년도 2학기 “통계패키지활용” 강의 노트와 동국대학교 ICT빅데이터학부 김진석 교수님의 R 프로그래밍 및 실습 강의 자료 내용과 구성을 참고하여 작성함.

재택 수업 시 학생들이 사용하고 있는 컴퓨터의 인터넷 접속이 원활하다는 가정 하에서 강의를 진행할 예정이기 때문에 수강 시 온라인 상태 유지가 필수임.

강의소개

R은 뉴질랜드 오클랜드 대학의 Robert Gentleman 과 Ross Ihaka 가 AT&T 벨 연구소에서 개발한 S 언어를 기반으로 개발한 GNU 환경의 통계 계산 및 프로그래밍 언어이다. 현재 R 소프트웨어는 통계학 뿐 아니라 데이터 과학을 포함한 의학, 생물학 등 다양한 분야에서 활용되고 있으며 특히 통계 소프트웨어 개발과 데이터 분석에 많이 활용되고 있다. 본 강의는 데이터 분석을 위한 R의 기초 문법과 통계학 입문에서 학습한 몇 가지 중요한 통계적 이론에 대한 시뮬레이션 방법을 다룬다. 아울러 R package를 활용한 데이터 헨들링 및 시각화 그리고 Rmarkdown을 활용한 재현가능(reproducible)한 문서 작성법에 대해 학습하고자 한다.

교과 목표

  • R 기초 문법 습득
  • R package를 활용한 데이터 핸들링 및 자료 시각화
  • R 시뮬레이션을 통한 통계학 기초 이론 확인
  • R을 이용한 데이터 분석 실습
  • R markdown을 이용한 재현가능(reproducible)한 보고서 작성 방법 습득

선수과목

통계학 개론

수업 방법

  • 강의: 50 %
  • 실험/실습: 50%

평가방법

  • 중간고사: 40 %
  • 기말고사: 40 %
  • 출석: 10 %
  • 과제: 10 %

수업 규정

  • 3번 지각은 1번 결석으로 처리
  • 특별한 사유 없이 수업 중간에 이탈한 경우 결석으로 처리
  • 특별한 사유로 인해 결석 또는 지각을 할 경우 사유를 증빙할 수 있는 서류 제출 시 출석으로 인정
  • 출결 미달, 중간 또는 기말고사 미 응시인 경우 F 학점으로 처리
  • 수업 중 휴대폰 및 각종 모바일 기기 사용 금지

교재 및 참고문헌

별도의 교재 없이 본 강의 노트로 수업을 진행할 예정이며, 수업의 이해도 향상을 위해 아래 소개할 도서 및 웹 문서 등을 참고할 것을 권장함.

참고 자료

강의 계획

Table 0.1: 강의 계획표
주차 강의 내용 과제
Week 1 R 소개, R/R Studio 설치, R 패키지 설치, R 맛보기 및 markdown 문서 만들기 과제 1
Week 2 R 자료형: 스칼라, 벡터, 리스트
Week 3 R 자료형: 행렬 및 배열 과제 2
Week 4 R 자료형: 팩터, 테이블, 데이터 프레임
Week 5 R 자료형: 문자열과 정규 표현식 과제 3
Week 6 데이터 프레임 가공 및 시각화 I
Week 7 데이터 프레임 가공 및 시각화 II 과제 4
Week 8 중간고사
Week 9 데이터 프레임 가공 및 시각화 III
Week 10 R 프로그래밍: 조건문, 반복문, 함수 과제 5
Week 11 통계시뮬레이션 I: 표본분포 및 중심극한정리
Week 12 통계시뮬레이션 2: 신뢰구간과 가설검정 과제 6
Week 13 R을 이용한 기초통계 분석
Week 14 R markdown 활용 과제 7
Week 15 기말고사

References

Rizzo, Maria L. 2019. Statistical Computing with R. CRC Press.

Wickham, Hadley. 2016. ggplot2: Elegant Graphics for Data Analysis. Springer.

Wickham, Hadley, and Garrett Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. " O’Reilly Media, Inc.".

Xie, Yihui. 2016. Bookdown: Authoring Books and Technical Documents with R Markdown. Boca Raton, Florida: Chapman; Hall/CRC. https://github.com/rstudio/bookdown.

권재명. 2017. 실리콘밸리 데이터 과학자가 알려주는 따라하며 배우는 데이터 과학. 1st ed. 제이펍.

매트로프. 2012. 빅데이터 분석 도구 R 프로그래밍. Translated by 권정민. 1st ed. 에이콘출판.

서민구. 2014. R을 이용한 데이터 처리&분석. 1st ed. 길벗.

유충현, 이상호, and 김정일. 2005. R 그래픽스. 1st ed. 자유아카데미.