[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지 5차 미션

2020. 8. 14. 21:36카테고리 없음

 

[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지 5차 미션

 

패스트캠퍼스의 강의 중, 프로젝트와 함께 배우는 R 데이터 분석 올인원 패키지 Online를 수강하고 있습니다.

https://bit.ly/2DKMGNx 

내용을 복습도 할 겸, 미션에도 참가할 겸, 블로그에 매일 매일 정리해 보게 되었습니다.

 

4회차 부터는 인증용 스크린샷은 좀 더 학습에 최적화해서 의미없는 스크린샷보다는 글 내용과 관련있는 스크린샷을 요약글 중간중간에 삽입하는 형태로 처리~

 

오늘은 5회차 미션!

Part 2) [R로 하는 데이터 분석] 데이터 분석 기본기 익히기

  1. 02. Ch 03. 데이터의 세계로 - 02. 데이터 프레임 만들기

  2. 03. Ch 03. 데이터의 세계로 - 03. 외부 데이터를 R로 가져오기

 

1. 02. Ch 03. 데이터의 세계로 - 02. 데이터 프레임 만들기

  1. 또 3분대의 짧은 강의 . 왜 앞 강의랑 하나로 합치지 않았을까요?

  2. 예제 따라하기

    1. history <- c(90, 80, 60, 70)

    2. math <-  c(50, 60, 100, 20)

    3. df_midterm <- data.frame(history, math)

    4. df_midterm

    5. mean(df_midterm$history)

    6. mean(df_midterm$math)

  3. 여기서 알아야 할 것은 두 개 이상의 배열 데이터를 data.frame()으로 데이터 프레임 데이터로 만들 수 있음

  4. 데이터 프레임 내의 각각의 변수는 $를 이용하여 가져올 수 있음

 

2. 03. Ch 03. 데이터의 세계로 - 03. 외부 데이터를 R로 가져오기

  1. 엑셀 데이터 가져오기 

    1. 엑셀 데이터는 활용할 일이 많기 때문에 매우 유용!!!

  2. 코드

    1. install.packages("readxl") //다 소문자

    2. library(readxl)

    3. df_finalexam <-  read_excel("finalexam.xlsx", sheet = 1, col_names = T) 

    4. df_finalexam

  3. 위 코드 설명

    1. working directory변경 중요!,

    2. sheet 는 몇번째 시트?

    3. col_names는 column이름까지 가져올 지 여부를 결정

      1. T = TRUE 

        1. 첫줄을 name으로 사용

      2. F를 쓰면 임의의 이름을 설정하고 첫줄도 데이터로 인식

        1. 이름없이 첫줄부터 데이터인 엑셀파일을 읽어들일 때 사용

  4. csv 데이터 가져오기

    1. read.csv("csv_exam.csv", header = T)

    2. 이 함수는 R의 내장 함수!

    3. header는 read_excel의 col_names와 동일

    4. csv_data <-  read.csv("csv_exam.csv", header = T)와 같이 할당하는 것도 가능

  5. csv로 저장하기

일단 데이터 프레임에 대한 추가 설명.

그리고 외부 데이터를 가져오는 법.

외부 데이터를 쓰는 경우가 대부분이기 때문에 아주 중요한 부분

엑셀 파일과 csv만 가져올 수 있으면 거의 모든 상황을 커버할 수 있을 듯