728x90 k-평균3 [머신러닝] UCI Wholesale Dataset: KMeans 군집 분석 수행 내용 UCI Wholesale 데이터셋을 활용하여 데이터 분석 및 KMeans 군집화 수행 ◆ UCI Wholesale 데이터셋이란?https://archive.ics.uci.edu/dataset/292/wholesale+customersUCI Wholesale 데이터셋은 도매 유통업체의 고객 구매 내역을 담고 있는 데이터셋으로, 각 고객의 연간 구매금액을 카테고리별로 구분하여 정리한 데이터셋이다. 사실, 해당 데이터셋을 수업 시간에 다뤄보기는 했는데, 이 데이터셋을 통해 알고자 하는 것이 무엇인지, 분석의 목적이 무엇인지, KMeans 같은 군집분석을 통해 알 수 있는 것에 대한 설명과 이해가 부족하여 혼자서 진행하며 제대로 이해해 보려고 한다. ◆ 이 데이터셋의 K-means 군집화 주요 목적.. 2025. 2. 16. [머신러닝] 군집: k-평균 알고리즘 훈련하기 k-평균 [머신러닝] 군집화: k-평균군집화란? [머신러닝] 군집화 (Clustering)군집화(Clustering) [군집]군집은 비슷한 샘플을 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업으로, 데이터 분석, 고객 분류, 추천 시스템, 검색 엔puppy-foot-it.tistory.com k-평균 알고리즘은 클러스터링 알고리즘 중 하나로, 주어진 데이터를 k개의 클러스터로 묶는 방법이며, 이를 위해 먼저 k개의 클러스터 중심(센트로이드)을 무작위로 선정하고, 각 데이터를 그 중 가장 가까운 클러스터 중심에 속하도록 할당한다. 그리고 다시 클러스터 중심을 해당 클러스터에 속하는 데이터들의 평균값으로 재계산하고, 이를 반복하여 더 이상 클러스터 중심이 움직이지 않을 때까지 계속해서 갱신한다. 하.. 2024. 11. 16. [머신러닝] 군집화: k-평균 군집화란? [머신러닝] 군집화 (Clustering)군집화(Clustering) [군집]군집은 비슷한 샘플을 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업으로, 데이터 분석, 고객 분류, 추천 시스템, 검색 엔진, 이미지 분할, 준지도 학습, 차원 축소puppy-foot-it.tistory.comk-평균 k-평균은 군집 중심점(centroid)이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법이다. 또한, 반복 몇 번으로 데이터셋을 빠르고 효율적으로 클러스터로 묶을 수 있는 간단한 알고리즘이다.군집 중심점은 선택된 포인트의 평균 지점으로 이동하고 이동된 중심점에서 다시 가까운 포인트를 선택, 다시 중심점을 평균 지점으로 이동하는 프로세스를 반복적으로 수행하며.. 2024. 10. 25. 이전 1 다음 728x90