데이터로그😎
군집 (clustering) 본문
군집(clustering)
- 고객, 마켓, 브랜드 등을 세분화/ 이미지 검출/이상 검출.. 등에 사용됨.
- 데이터의 특성을 파악해서 유사한 특성을 가진 데이터들끼리 그룹화 하는 것.
- 데이터의 특성을 이용해 서로 다른 그룹을 구분하는데, 이를 통해 데이터의 구조나 패턴을 파악할 수 있음.
모수 추정 방법 (Parametric Clustering) |
비모수 추정 방법 (Non-parametric Clustering) |
|
정의 |
|
|
종류 | K-Means , GMM | DBSCAN, Hierarchical Clustering, Mean Shift |
모수 추정 방법(Parametric Clustering)
k-means | GMM(Gaussian Mixture Model) | |
군집 개수 | 군집 개수 parameter 사전 설정 | |
군집 방식 | 거리 중심 기반 | 확률 기반 |
언제 사용? | 클러스터 개수를 미리 알고 있을 때 | |
진행 과정 |
|
|
파라미터 |
|
|
기타 |
|
- 통발 미리 만들어놓고 물고기를 분류하는.. - 모수 추정을 위해 EM(expectation, maximization) 사용
|
비모수 추정 방법 (Non-parametric Clustering)
Meanshift | DBSCAN | |
군집 개수 | 사전 설정 X | |
기반 | 밀도 기반 | |
언제 사용? | 데이터가 밀도가 높은 영역에 모여있는 경우 | 높은 차원 데이터에 대해 |
특징 |
|
|
'머신러닝 > 비지도 학습' 카테고리의 다른 글
군집 평가 (0) | 2023.09.05 |
---|---|
Meanshift vs DBSCAN (0) | 2023.09.05 |
KMeans, GMM (0) | 2023.09.05 |