TOP
class="layout-aside-left paging-number">
본문 바로가기
728x90

K-Means2

[머신러닝] UCI Wholesale Dataset: KMeans 군집 분석 수행 내용 UCI Wholesale 데이터셋을 활용하여 데이터 분석 및 KMeans 군집화 수행 ◆ UCI Wholesale 데이터셋이란?https://archive.ics.uci.edu/dataset/292/wholesale+customersUCI Wholesale 데이터셋은 도매 유통업체의 고객 구매 내역을 담고 있는 데이터셋으로, 각 고객의 연간 구매금액을 카테고리별로 구분하여 정리한 데이터셋이다. 사실, 해당 데이터셋을 수업 시간에 다뤄보기는 했는데, 이 데이터셋을 통해 알고자 하는 것이 무엇인지, 분석의 목적이 무엇인지, KMeans 같은 군집분석을 통해 알 수 있는 것에 대한 설명과 이해가 부족하여 혼자서 진행하며 제대로 이해해 보려고 한다.  ◆ 이 데이터셋의 K-means 군집화 주요 목적.. 2025. 2. 16.
[머신러닝] 군집: k-평균 알고리즘 훈련하기 k-평균  [머신러닝] 군집화: k-평균군집화란? [머신러닝] 군집화 (Clustering)군집화(Clustering) [군집]군집은 비슷한 샘플을 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업으로, 데이터 분석, 고객 분류, 추천 시스템, 검색 엔puppy-foot-it.tistory.com  k-평균 알고리즘은 클러스터링 알고리즘 중 하나로, 주어진 데이터를 k개의 클러스터로 묶는 방법이며, 이를 위해 먼저 k개의 클러스터 중심(센트로이드)을 무작위로 선정하고, 각 데이터를 그 중 가장 가까운 클러스터 중심에 속하도록 할당한다. 그리고 다시 클러스터 중심을 해당 클러스터에 속하는 데이터들의 평균값으로 재계산하고, 이를 반복하여 더 이상 클러스터 중심이 움직이지 않을 때까지 계속해서 갱신한다. 하.. 2024. 11. 16.
728x90