2020. 9. 23. 01:30ㆍ카테고리 없음
[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지 45차 미션
패스트캠퍼스의 강의 중, 프로젝트와 함께 배우는 R 데이터 분석 올인원 패키지 Online를 수강하고 있습니다.
내용을 복습도 할 겸, 미션에도 참가할 겸, 블로그에 매일 매일 정리해 보게 되었습니다.
오늘은 45회차 미션!
-
07. Ch 02. Principal Component Analysis (PCA) - 06. PCA 예제 실습 2
-
08. Ch 03. k-Means Analysis - 01. k-Means Analysis의 개념 이해
-
07. Ch 02. Principal Component Analysis (PCA) - 06. PCA 예제 실습 2
-
고양이 사진을 가지고 주성분 분석을 할 것
-
앞서 강의에서는 데이터 확인을 했지만, 이미지를 가지고 할 때는 결측치 같은 건 확인할 필요가 없음
-
구글에서 찾은 고양이 사진으로 작업해볼 것
-
라이브러리
-
library(jpeg)
-
cat <- readJPEG('cat.jpeg')
-
class(cat)
-
JPEG 내용은 Array형태임.
-
-
1365, x 2048에 대해 RGB가 3차원 데이터로 이루어져 있음
-
이 데이터를 2차원으로 분리해줌
-
나중 강의에서 좀 더 자세히 설명해줌 (RGB변환에 대해서)
-
RGB데이터를 변환할 때, center = F (표준화를 하지 않음)
-
나중에도 다른 방법을 쓸 때도 나오는 내용이지만
-
RGB의 조합이 어마어마하게 많은데, 이를 차원 축소를 통해서 적은 수의 색깔로 표현하는 것
-
즉, 아래와 같이
-
2개의 대표색을 결정해서 보여주는 것
-
그 외에도 10개, 50개, 100개, 300개의 대표색을 결정해서 보여주는 것
-
08. Ch 03. k-Means Analysis - 01. k-Means Analysis의 개념 이해
-
Clustering (군집화)
-
유사한 성질을 가지는데이터끼리 cluster (군집)을 나누는 과정
-
목표
-
군집 내 데이터들의 거리는 가깝게
-
군집 간의 거리는 멀게
-
K-means clustering
-
K개의 중심을 정하고, 그 중심을 기반으로 클러스터링을 함
-
예시
-
b에서 2개의 점을 지정
-
그 점을 중심으로 군집을 함
-
군집데이터의 중심점을 찾음 (c)
-
그리고서 다시 군집
-
다시 중심 찾고..
-
이를 반복하는것..
-
데이터 간의 거리를 측정하는 방법
-
유클리드 거리와 맨하튼 거리
-
K-means clustering의 활용
-
고객 유형을 분류하여 상품 판매 전략 도출
-
제품의 성분 및 특성에 따라 분류하여 제품 추천 로직 개발
-
이미지 색상 축소
K means 군집화의 일반적인 설명