나름개발블로그
Hands-on ML 1장 본문
머신러닝 시스템의 종류
학습하는 동안 감독 형태나 , 정보량으로 구분
지도 학습 (supervised learning)
- 말 그대로 훈련데이터에 답을 넣어주는 학습
- 분류 (classification ) , 회귀(regression)가 대표적
비지도 (unsupervised leanring)
- 그대로 훈련 데이터에 레이블이 없음
- 군집 (clustring) ,시각화 ( visualization) , 차원 축소(dimensionality reduction) ,이상치 탐지(outlier detection), 연관 규칙 학습(association rule learing)
준지도 (semisupervised learning)
- 지도학습 + 준지도 학습
강화 학습 (reinforcement learning)
- 행동하고 보상, 벌점을 통해 , 가장 큰 보상을 얻기 위해 최상의 전략을 스스로 학습!!!
- 예를 들어 알파고
입력 방법으로 분류
배치학습 (batch learning)
- 오프라인 학습이라고도 한다
온라인 학습 (online learning)
- 점진적 학습
일반화 (generalize) 되는가에 따른 분류
사례 기반 학습 (instance-based learnring)
모델 기반 학습 (model-based learning)
머신러닝의 도전과제!!
나쁜 데이터 사례
충분하지 않은 데이터
대표성 없는 훈련 데이터
- 샘플링 잡음 (sampling noise), 샘플링 편향 (sampling bias)
낮은 품질의 데이터
- 데이터 정제의 필요
관련 없는 특성
나쁜 알고리즘 사례
과대적합 (overfitting)
- - 훈련데이터에 잘맞지만 , 일반성이 떨어짐
- 해결 방안
- 파라미터 적은 모델선택
- 훈련 데이터를 더모음
- 훈련 데이터 잡읍 줄이기
과소적합 (underfitting)
- 과대적합 의반대
- 해결방안
- 모델 파라미터가 많은 모델 선택
- 학습 알고리즘에서 더좋은 특성 제공
테스트와 검증
훈련 세트와 테스트 세트를 구분 !
- 훈련 오차가 낮지만 일반화 오차가 높다면 훈련데이터에 과적합(overfitting)
하이퍼 파리미터 튜딩 모델 선택
홀드아웃 검증 (holdout validation)
- validation 세트를 이용 ( train set에서 조금 때세 만듬)
교차 검증 (cross validation)
- 작은 validation 세트 여거개를 사용하는 반복적인 검증
키워드
regularization : 규제
hyperparmeter : 적용할 규제의 양, 학습 알고리즘의 파라미터
train : 말그대로 훈련
accuracy : 성능 측정에 쓰인다! 정확도
data mining : 머신러닝을 이용해서 겉으로 보이지 않은 패턴등을 발견
'A > ML' 카테고리의 다른 글
Hands-On ML 6장 (0) | 2020.09.14 |
---|---|
Hands-On ML 5장 (0) | 2020.09.13 |
Hands-On ML 4장 (0) | 2020.09.12 |
Hands-On ML 3장 (0) | 2020.09.11 |
Hands-On ML 2장 (0) | 2020.09.10 |
Comments