목록A/ML (19)
나름개발블로그
MNIST 머신러닝계의 "Hello World" 이진 분류기 훈련(Binary classifier) 두가지중 하나로 분류 (Y or N) SGDClassifier 여기서 SGD란 (Stochastic Gradient Descent) 확률적 경사 하강법 성능측정 교차 검증을 사용한 정확도측정 cross_val_score (sklearn) 정확도(accuracy)는 분류기 성능 측정지표로 선호하지 않는다. 특흐 불균형한 데이터 셋을 다룰때 오차행렬(confusion matrix) cross_val_predict (sklearn) : cross_val_score 와 다르게 평가 점수를 반환 하는게 아니라 예측을 반환 한다. confusion_matrix (sklearn) from sklearn.metrics ..
큰 그림 보기 머신러닝 프로젝트의 체크리스트를 준비하는게 좋다! 문제 정의 무엇을 해결 할 것이냐 성능 측정 지표 선택 RMSE 평균 제곱근 오차 MAE 평균 절대 오차 가정 검사 데이터 가져오기 데이터 준비하기 모델 선택과 훈련 교차 검증을 사용한 평가 모델 세부 튜닝 GridSearch RandomSearch Emsemble 론칭 모니터링 시스템 유지보수 keyword One-hot encoding : 한 특성 만 1(hot) 나머지는 0으로 ! feature scaling
머신러닝 시스템의 종류 학습하는 동안 감독 형태나 , 정보량으로 구분 지도 학습 (supervised learning) 말 그대로 훈련데이터에 답을 넣어주는 학습 분류 (classification ) , 회귀(regression)가 대표적 비지도 (unsupervised leanring) 그대로 훈련 데이터에 레이블이 없음 군집 (clustring) ,시각화 ( visualization) , 차원 축소(dimensionality reduction) ,이상치 탐지(outlier detection), 연관 규칙 학습(association rule learing) 준지도 (semisupervised learning) 지도학습 + 준지도 학습 강화 학습 (reinforcement learning) 행동하고 보상..