데이터로그😎

머신러닝의 분류 본문

#4. 기타 공부/#4.2. 머신러닝

머신러닝의 분류

지지킴 2023. 8. 30. 17:11
<지도학습 vs 비지도 학습/ 준지도 학습/ 강화학습> 의 차이는 무엇인가?

 

1. 지도학습: 알고리즘에 주입하는 훈련 데이터에 레이블 이라는 원하는 답이 포함

  • 분류: yes or no를 구분하는 학습.
  • 회귀: feature(ex. 주행거리, 연식, 브랜드 등)를 사용해 중고차 가격과 같은 target(타깃) 수치를 예측하는 것.

1-1. 지도 학습의 알고리즘

  • k-최근접 이웃(KNN)
  • 선형 회귀(Linear Regression)
  • 로지스틱 회귀(Logistic Regression)
  • 서포트 벡터 머신(SVM)
  • 결정 트리(decision tree) & 랜덤 포레스트(random forest)
  • 신경망(neural network)

2. 비지도 학습: 훈련 데이터에 레이블이 없음! 시스템이 아무런 도움 없이 학습해야 함.

  • 군집, 이상치/특이치 탐지, 시각화&차원축소

2-1. 비지도 학습의 알고리즘

알고리즘 군집(clustering) 이상치 탐지, 특이치 탐지 시각화 & 차원축소
종류
  • K-Means
  • DBSCAN
  • 계층 군집 분석(HCA)
  • 원 클래스
  • 아이솔레이션 포레스트
  • 주성분 분석(PCA)
  • 커널 PCA
  • 지역적 선형 임베딩(LLE)
  • t-SNE
  •  
  • 차원축소:
    • 너무 많은 정보를 잃지 않으면서 데이터를 간소화 하는 것.
    • 상관관계가 있는 여러 특성을 하나로 합치며 차원 축소를 할 수 있음.
      • 예) 차의 주행거리 - 연식: 강한 상관관계 → 차원축소 알고리즘으로 두 특성을 차의 마모 정도를 나타내는 하나의 특성으로 합칠 수 있음 → 특성 추출
        • 특성선택(feature selection): 가지고 있는 특성 중에서 훈련에 가장 유용한 특성을 선택합니다.
        • 특성추출(feature extraction): 특성을 결합하여 더 유용한 특성을 만듭니다. 앞서 본 것처럼 차원 축소 알고리즘이 도움이 될 수 있다.
  • 연관 규칙 학습
    • 대량의 데이터에서 특성 간의 흥미로운 관계를 찾는 것.
      • 예) 슈퍼마켓에서 바비큐소스, 감자 구매한 사람이 스테이크도 구매하는 경향이 있다.→ 이 상품들을 서로 가까이 진열할 수 있을 것.
    • 어프라이어리
    • 이클렛

3. 준지도 학습: 레이블이 없는 샘플도 많고, 레이블 된 샘플은 적은 경우가 많음. 일부만 레이블이 있는 데이터를 다루는 것

  • 지도학습 + 비지도 학습의 조합.
  • 온라인 학습, 배치학습
    • 입력 데이터의 스트림으로부터 점진적으로 학습할 수 있는지 여부.
    • 배치학습: 시스템이 점진적 학습 X. 가용한 데이터를 모두 사용해 훈련시켜야 함.
    • 온라인 학습: 데이터를 순차적으로 한개씩 또는 미니배치(작은 묶음 단위)를 주입해 시스템 훈련.
    • 중요 파라미터: 학습률(learning_rate)

'#4. 기타 공부 > #4.2. 머신러닝' 카테고리의 다른 글

[지도학습] 2. Decision Tree  (1) 2023.09.04
[지도학습] 0. 분류(Classification)  (0) 2023.09.04
[지도학습] 1. 분류의 평가지표  (0) 2023.09.04
데이터 전처리  (0) 2023.09.03
model_selection 모듈  (1) 2023.09.03