2020. 8. 26. 08:30ㆍ카테고리 없음
[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지17차 미션
패스트캠퍼스의 강의 중, 프로젝트와 함께 배우는 R 데이터 분석 올인원 패키지 Online를 수강하고 있습니다.
내용을 복습도 할 겸, 미션에도 참가할 겸, 블로그에 매일 매일 정리해 보게 되었습니다.
오늘은 17회차 미션!
Part 2) [R로 하는 데이터 분석] 데이터 분석 기본기 익히기
-
07. Ch 01. 가설 검정하기 - 02. 두 집단 간 평균 비교하기 - 06
-
대응 표본 검정
-
대응 표본?
-
동일한 대상의 '변화량'을 비교하는 경우
-
지난 강의의 경우에는 서로 다른 두 집단을 비교
-
두 집단의 키 평균을 비교한다든지
-
예를 들면,
-
한 집단의 체중 변화
-
성적변화 등
-
이 경우에는 '차이값'을 분석하게 됨
-
-
위와 같이 t값을 계산하고, 이를 통해 t분포에서 P값을 구하고 0.05와 비교해서 검정
-
연습
-
마케팅에 따른 판매액 차이
-
마케팅 캠페인의 판매액의 평균은 10500 -> 23800 으로 증가
-
대응표본 t-test에서는 정규성 검정만 함. (분산 동질성 검사는 하지 않음)
-
왜냐면 검증할 대상이 before, after의 차이, 1그룹뿐이기때문!
-
검증 결과 귀무가설 채택!
-
결과적으로 마케팅을 통한 판매액의 변화가 있다. (증가했다!)는 결론!
-
p=0.006745 < 0.05
-
paired = TRUE를 사용했다는 것에 주의!!!
-
08. Ch 01. 가설 검정하기 - 02. 두 집단 간 평균 비교하기 - 07
-
z 검정
-
그룹의 개수가 2개 이하이면서 데이터 갯수가 30개 초과 (대표본 문제)
-
대표본일 때는 '정규분포를 따른다!'
-
따라서 정규성 검정을 할 필요가 없음!
-
z값을 구한 후 (z값 = 정규분포)
-
z=1.34를 기준으로 p값을 구하면 됨
-
t분포와 z분포의 차이
-
t분포는 꼬리가 두껍고, 0에서 낮아.. (대략 모양은 비슷하지만..)
-
실습
-
R에는 z-test함수가 없음
-
여기서 사용한 것은 강사가 만들어둔 함수
-
이걸 사용!
-
위 테스트에서는 p = 0.04866272 < 0.05
-
대립가설 채택
-
평균이 겨우 179 < 181이지만, 평균에 차이가 있다는 결론!
-
앞서 다뤘던 예제에선 170, 181의 차이였는데도, 평균의 차이가 없다는 결론이 났음
-
즉, 평균만으로 판단하면 안됨 (분산 고려 필요!)
-
하나 더..
-
t-test에 적용해보자.
-
p값이 0.05136 > 0.05 로 나옴..
-
즉, 귀무가설이 채택됨
-
상태) 물론 P=0.0514정도로 작은 값이므로, 거의 대립가설이 채택될 뻔한 수치이긴 함.
앞서 다루었던 테스트는 소표본이었고, 그룹간의 비교였음.
여기서는 대응표본 테스트와 대표본 테스트
실제로 쓸 일이 많아 보이는 테스트!
꼭 기억해 두고 실무에 활용하자!