[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지17차 미션

2020. 8. 26. 08:30카테고리 없음

[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지17차 미션

 

패스트캠퍼스의 강의 중, 프로젝트와 함께 배우는 R 데이터 분석 올인원 패키지 Online를 수강하고 있습니다.

https://bit.ly/2DKMGNx 

내용을 복습도 할 겸, 미션에도 참가할 겸, 블로그에 매일 매일 정리해 보게 되었습니다.

 

오늘은 17회차 미션!

Part 2) [R로 하는 데이터 분석] 데이터 분석 기본기 익히기

  1. 07. Ch 01. 가설 검정하기 - 02. 두 집단 간 평균 비교하기 - 06

    1. 대응 표본 검정

      1. 대응 표본?

        1. 동일한 대상의 '변화량'을 비교하는 경우

          1. 지난 강의의 경우에는 서로 다른 두 집단을 비교

            1. 두 집단의 키 평균을 비교한다든지

        2. 예를 들면, 

          1. 한 집단의 체중 변화

          2. 성적변화 등

      2. 이 경우에는 '차이값'을 분석하게 됨

    2.  

    3. 위와 같이 t값을 계산하고, 이를 통해 t분포에서 P값을 구하고 0.05와 비교해서 검정

    4. 연습

      1. 마케팅에 따른 판매액 차이

        1. 마케팅 캠페인의 판매액의 평균은 10500 -> 23800 으로 증가

    5. 대응표본 t-test에서는 정규성 검정만 함. (분산 동질성 검사는 하지 않음)

      1. 왜냐면 검증할 대상이 before, after의 차이, 1그룹뿐이기때문!

        1. 검증 결과 귀무가설 채택!

      2. 결과적으로 마케팅을 통한 판매액의 변화가 있다. (증가했다!)는 결론!

        1. p=0.006745 < 0.05

      3. paired = TRUE를 사용했다는 것에 주의!!!

  2. 08. Ch 01. 가설 검정하기 - 02. 두 집단 간 평균 비교하기 - 07

    1. z 검정

      1. 그룹의 개수가 2개 이하이면서 데이터 갯수가 30개 초과 (대표본 문제)

        1. 대표본일 때는 '정규분포를 따른다!'

        2. 따라서 정규성 검정을    할 필요가 없음!

        3. z값을 구한 후 (z값 = 정규분포)

          1. z=1.34를 기준으로 p값을 구하면 됨

      2. t분포와 z분포의 차이

        1. t분포는 꼬리가 두껍고, 0에서 낮아.. (대략 모양은 비슷하지만..)

      3. 실습

        1. R에는 z-test함수가 없음

          1. 여기서 사용한 것은 강사가 만들어둔 함수

            1. 이걸 사용!

        2. 위 테스트에서는 p = 0.04866272 < 0.05

          1. 대립가설 채택

            1. 평균이 겨우 179 < 181이지만, 평균에 차이가 있다는 결론!

              1. 앞서 다뤘던 예제에선 170, 181의 차이였는데도, 평균의 차이가 없다는 결론이 났음

                1. 즉, 평균만으로 판단하면 안됨 (분산 고려 필요!)

      4. 하나 더..

        1. t-test에 적용해보자.

          1. p값이 0.05136 > 0.05 로 나옴..

            1. 즉, 귀무가설이 채택됨

              1. 상태) 물론 P=0.0514정도로 작은 값이므로, 거의 대립가설이 채택될 뻔한 수치이긴 함.

 

앞서 다루었던 테스트는 소표본이었고, 그룹간의 비교였음.

여기서는 대응표본 테스트와 대표본 테스트

실제로 쓸 일이 많아 보이는 테스트!

꼭 기억해 두고 실무에 활용하자!