Study/AI, 머신러닝, CNN 딥러닝

[머신러닝 기초] 이론 04 - 분류 Classification

도엔 2025. 1. 2. 20:10
728x90

# 분류 Classification

0. 분류(Classification)와 회귀(Regression)의 차이

 - 분류: 불연속적인 값을 예측

 - 회귀: 연속적인 값을 예측

 

 

1. 분류 모델

  : 주어진 데이터셋을 두 개 이상의 그룹으로 나누는 직선(Classifier)을 찾음

 

 - 데이터를 시각화하고 이를 기준으로 Classifier 학습

 - 데이터셋을 이용하여 lable 예측 (지도학습)

 - Category 예측

 - 이상적인 직선은 데이터를 완벽히 나누지 못하더라도 최적화된 Classifier를 학습.

 

 

2. Cost Function(비용 함수)

 - Classifier 비교를 위한 Cost 정의

  1) 에러 개수: 잘못 분류된 데이터의 개수 (성능)

  2) 수직 거리 합: 잘못 분류된 데이터와 직선 간의 거리 합산 (복잡함)

  3) Score : 각 데이터의 정확도 평가

 

 

3. 스스로 찾게하는 학습 알고리즘

 1) Classifier 랜덤 설정

 2) 정확히 분류하면 그대로 둠.

 

 

+ 분류의 응용 사례

 - 이메일 스팸 필터링

 - 해킹된 고객 계정 탐지

 - 날씨 예측 (맑음, 흐림, /눈 등)

 - 암 악성 여부 판별

728x90
반응형