Notice
Recent Posts
Today
Total
«   2024/07   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
관리 메뉴

나름개발블로그

Hands-on ML 1장 본문

A/ML

Hands-on ML 1장

성남개발자 2020. 9. 9. 17:39

머신러닝 시스템의 종류 

학습하는 동안 감독 형태나 , 정보량으로 구분

지도 학습 (supervised learning)

  • 말 그대로 훈련데이터에 답을 넣어주는 학습 
  • 분류 (classification ) , 회귀(regression)가 대표적

비지도 (unsupervised leanring) 

  •  그대로 훈련 데이터에 레이블이 없음
  •  군집 (clustring) ,시각화 ( visualization) , 차원 축소(dimensionality reduction) ,이상치 탐지(outlier detection), 연관 규칙 학습(association rule learing)

준지도 (semisupervised learning)

  •  지도학습 + 준지도 학습

강화 학습 (reinforcement learning)

  •  행동하고 보상, 벌점을 통해 , 가장 큰 보상을 얻기 위해 최상의 전략을 스스로 학습!!!
  •  예를 들어 알파고 

입력 방법으로 분류 

배치학습 (batch learning) 

  • 오프라인 학습이라고도 한다 

온라인 학습 (online learning)

  • 점진적 학습 

일반화 (generalize) 되는가에 따른 분류

사례 기반 학습 (instance-based learnring)

모델 기반 학습 (model-based learning)


머신러닝의 도전과제!! 

나쁜 데이터 사례

충분하지 않은 데이터 

대표성 없는 훈련 데이터

  • 샘플링 잡음 (sampling noise), 샘플링 편향 (sampling bias)

낮은 품질의 데이터 

  • 데이터 정제의 필요

관련 없는 특성 

 

나쁜 알고리즘 사례

과대적합 (overfitting)

  •  - 훈련데이터에 잘맞지만 , 일반성이 떨어짐
  •  해결 방안 
    •  파라미터 적은 모델선택
    • 훈련 데이터를 더모음
    • 훈련 데이터 잡읍 줄이기

과소적합 (underfitting)

  • 과대적합 의반대 
  • 해결방안
    • 모델 파라미터가 많은 모델 선택
    • 학습 알고리즘에서 더좋은 특성 제공

테스트와 검증

훈련 세트와 테스트 세트를 구분 !

  • 훈련 오차가 낮지만 일반화 오차가 높다면 훈련데이터에 과적합(overfitting)

하이퍼 파리미터 튜딩 모델 선택

홀드아웃 검증 (holdout validation) 

  • validation 세트를 이용 ( train set에서 조금 때세 만듬)

교차 검증 (cross validation) 

  • 작은 validation 세트 여거개를 사용하는 반복적인 검증

 

키워드 

regularization : 규제

hyperparmeter : 적용할 규제의 양, 학습 알고리즘의 파라미터

train : 말그대로 훈련 

accuracy : 성능 측정에 쓰인다! 정확도 

data mining : 머신러닝을 이용해서 겉으로 보이지 않은 패턴등을 발견

 

'A > ML' 카테고리의 다른 글

Hands-On ML 6장  (0) 2020.09.14
Hands-On ML 5장  (0) 2020.09.13
Hands-On ML 4장  (0) 2020.09.12
Hands-On ML 3장  (0) 2020.09.11
Hands-On ML 2장  (0) 2020.09.10
Comments