Study/AI, 머신러닝, CNN 딥러닝

[머신러닝 기초] 이론 02 - 머신러닝 학습 방식

도엔 2024. 11. 22. 23:44
728x90


주요 내용은 복습 겸 반복

# 머신러닝(ML)

: 데이터를 기반으로 학습하고 패턴을 예측하는 알고리즘의 개발과 구현에 중점을 둔다.

- 세부 단계
 1) 데이터 수집 및 처리: 대량의 데이터를 확보하고 정리
 2) 모델 학습: 데이터를 사용하여 알고리즘을 학습
 3) 예측 및 평가: 학습된 모델로 새로운 데이터를 예측하고 성능 평가


# 머신러닝 학습 방식

1. 지도 학습 Supervised Learning

 : 레이블(label)이 있는 데이터를 사용해 학습
   ex) 분류(Classification), 회귀(Regression)

2. 비지도 학습 Unsupervised Learning

 : 레이블이 없는 데이터를 통해 패턴이나 군집을 찾음
   ex) 클러스터링(Clustering)

3. 강화 학습 Reinforcement Learning

 : 환경과 상호작용하며 보상을 최대화하는 방향으로 학습


# 모델

1. 회귀 Regression

 : 연속적인 값을 예측하기
   ex) 주택 가격 예측

2. 분류 Classification

 : 데이터를 특정 클래스(범주)로 분류

3. 결정 나무 Decision Tree

 : 데이터를 기반으로 Yes/No 질문을 순차적으로 결정


 

# 데이터 전처리 및 라벨링 - 데이터셋 구축 과정

  - 요구사항 분석 : 필요한 데이터 정의
  - 데이터 수집 : 원본 데이터를 모음
  - 라벨링(Labeling) : 데이터를 분석 및 학습에 적합하게 정리
     ex) 이미지 태깅, 의료 기록



+ 예제) Iris 분류하기 (Decision Tree)


3가지 꽃 품종: Setosa, Versicolor, Virginica
Sepal(꽃받침)과 Petal(꽃잎)의 길이와 너비에 따라

Petal Length가 2.5보다 작으면 "Setosa"로 분류.
Petal Width가 1.6보다 작으면 "Versicolor", 크면 "Virginica".


+ 응용 분야
 음성 인식: AI 스피커
 의료: 학습용 의료 데이터 생성
 이미지 처리: 얼굴 인식, 자동차 인식
 데이터 라벨링: AI 학습용 데이터 구축 서비스



728x90
반응형