- CREATED

SUMMARY

세바스티안라슈카의 저서(번역본) PYTHON MACHINE LEARNING 을 공부하면서 요약한 내용이다.



1.2 머신러닝의 세 가지 유형

1.2.1 Supervised Learning - label이 있는 훈련 데이터로 모델을 학습하여 경험하지 못한 데이터나 미래의 데이터에 관한 예측을 만드는 것.

1.2.1.1 classification (분류 모델) - 지도 학습의 영역, 과거 관측치에 기반하여 새로운 인스턴스들의 분류 레이블을 예측하는 것 예) 이메일 스팸 탐지

  • multi-class classification(다중 분류 모델) : mnist (필기체 인식)


1.2.1.2 regression (회귀 분석) - 연속형 결과를 예측하는 것. 복수 개의 예측 변수들과 하나의 연속형 반응 변수(결과)가 주어진다. 예) 시험 점수에 대한 예측, 공부 시간과 점수 간의 관계 추론.


1.2.2 reinforcement learning(강화 학습) - 환경과의 상호작용을 기반으로 자신의 성능을 개선하는 시스템(에이전트)을 개발하는 것.

강화학습에서의 피드백은 절대적으로 옳은 레이블이나 값이 아니고, 행위를 보상 함수로 잘 측정할 수 있는 측정 기준에 관한 것이다. 예) 체스게임, 에이전트는 체스판의 상황에 따라 연속된 움직임을 결정하고 보상은 게임의 마지막에 승 혹은 패로 정의 될 수 있다.


1.2.3 unsupervised learning - 레이블이 없거나 구조를 모르는 데이터를 다룬다. 알려진 결과 변수나 보상함수의 도움을 받지않고서도 데이터 구조를 탐색하여 의미 있는 정보를 추출 할 수 있다.

1.2.3.1 clustering(군집분석) - 그룹 요소에 대한 어떤 사전 지식 없이도 정보의 더미를 의미있는 서브 그룹(군집)으로 구조화 할 수 있게 해주는 탐색적 데이터 분석 기법이다. 예) 마케팅 프로그램

1.2.3.2 데이터압축을 위한 차원 축소




2. 분류를 위한 머신러닝 알고리즘 훈련

로젠블렛의 초기 퍼셉트론 규칙 1) 가중치를 0 혹은 임의의 작은 숫자로 초기화한다. 2) 각각의 훈련 샘플 x(1)에 대해서 다음의 단계를 수행한다. a) 출력값 y를 계산한다. b) 가중치를 업데이트한다.


kchhero

If you do not act, there is no change.