카테고리 없음

[패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지 45차 미션

열린세계 2020. 9. 23. 01:30

 [패스트캠퍼스 수강 후기] R 인강 100% 환급 챌린지 45차 미션

 

패스트캠퍼스의 강의 중, 프로젝트와 함께 배우는 R 데이터 분석 올인원 패키지 Online를 수강하고 있습니다.

https://bit.ly/2DKMGNx 

내용을 복습도 할 겸, 미션에도 참가할 겸, 블로그에 매일 매일 정리해 보게 되었습니다.

 

오늘은 45회차 미션!

  1. 07. Ch 02. Principal Component Analysis (PCA) - 06. PCA 예제 실습 2

  2. 08. Ch 03. k-Means Analysis - 01. k-Means Analysis의 개념 이해

 

  1. 07. Ch 02. Principal Component Analysis (PCA) - 06. PCA 예제 실습 2

    1. 고양이 사진을 가지고 주성분 분석을 할 것

      1. 앞서 강의에서는 데이터 확인을 했지만, 이미지를 가지고 할 때는 결측치 같은 건 확인할 필요가 없음

      2. 구글에서 찾은 고양이 사진으로 작업해볼 것

    2. 라이브러리

      1. library(jpeg)

      2. cat <- readJPEG('cat.jpeg')

      3. class(cat)

    3. JPEG 내용은 Array형태임.

      1.  

      2. 1365, x 2048에 대해 RGB가 3차원 데이터로 이루어져 있음

    4. 이 데이터를 2차원으로 분리해줌

      1. 나중 강의에서 좀 더 자세히 설명해줌 (RGB변환에 대해서)

      2. RGB데이터를 변환할 때, center = F (표준화를 하지 않음)

    5. 나중에도 다른 방법을 쓸 때도 나오는 내용이지만

      1. RGB의 조합이 어마어마하게 많은데, 이를 차원 축소를 통해서 적은 수의 색깔로 표현하는 것

    6. 즉, 아래와 같이 

      1. 2개의 대표색을 결정해서 보여주는 것

      2. 그 외에도 10개, 50개, 100개, 300개의 대표색을 결정해서 보여주는 것

  2. 08. Ch 03. k-Means Analysis - 01. k-Means Analysis의 개념 이해

    1. Clustering (군집화)

      1. 유사한 성질을 가지는데이터끼리 cluster (군집)을 나누는 과정

      2. 목표

        1. 군집 내 데이터들의 거리는 가깝게

        2. 군집 간의 거리는 멀게

    2. K-means clustering

      1. K개의 중심을 정하고, 그 중심을 기반으로 클러스터링을 함

      2. 예시

        1. b에서 2개의 점을 지정

          1. 그 점을 중심으로 군집을 함

          2. 군집데이터의 중심점을 찾음 (c)

          3. 그리고서 다시 군집

            1. 다시 중심 찾고..

            2. 이를 반복하는것..

      3. 데이터 간의 거리를 측정하는 방법

        1. 유클리드 거리와 맨하튼 거리

      4. K-means clustering의 활용

        1. 고객 유형을 분류하여 상품 판매 전략 도출

        2. 제품의 성분 및 특성에 따라 분류하여 제품 추천 로직 개발

        3. 이미지 색상 축소

 

K means 군집화의 일반적인 설명