패턴 인식
주어진 데이터의 집합에 대해 입력값을 바탕으로 하는 Classification. MNIST 처럼 이미지에서 숫자를 도출하는 것도 좋은 예
- 구조적 방법 : 1은 하나의 직선에 가깝고 8은 원 두개.
- 템플릿 매칭 : 패턴의 원형을 저장해 두고 데이타간의 거리를 계산
- 기계학습
패턴 인식과 관련된 개념
1. 분류와 군집화
분류( Classification ) : MNIST로 숫자를 맞추는 형태
- 베이지안 분류기, K 근접 이웃, 다층 퍼셉트(MLP), 서포트 벡터 머신
- 지도학습
군집화( Clustering ) : 특성 고객층을 하나의 기준으로 분류하기 보다는 여러가지 기준이지만 뭉뚱그리는 것
- K 편균 클러스터링, 계층적 군집화, 자기조직화 특징맵(SOM)
- 비지도 학습
2. 데이터와 데이터 분포
여러가지 데이터들은 결국 컴퓨터에서 다루어질 수 있게 수치로 표현 되어야 한다. 이 숫자들을 1차원으로 나열하면 벡터, 차원이 높아지면 행렬이 되는데 이런 모임을 Tensorflow에서는 tensor 라고 지칭하고 딥러닝의 과정이 이 tensor가 움직이면서 나타나서 Tensorflow 를 이루게 된다.
- 표본집합 추출
- 특징추출
- 분류와 결정경계
분류율과 오차
학습 오차 : 학습데이타에 대하여 분류 오차를 계산한 것
테스트 오차 : 실제 데이타의 오차
일반화 오차 : 확률분포함수를 이용한 분포에 따른 평균 오차값. 테스트 오차가 절대값 수치 미적용에 따른 왜곡을 가질 수 있으므로 사용한다
교차검증법을 통해 오차값을 얻어내기도 한다
3. 과다 적합(overfitting)
- Classifier가 학습데이타에 대해서만 지나치게 적합한 형태로 결정경계를 형성하는 경우. train데이타의 범주를 벗어나는 경우는 제대로 분류하지 못하는 경우.
- Machine Learning 스터디 (3) Overfitting
4. 활용분야
- 문자 인식
- 생체인식
- 금융데이터
- 생물정보
- 뇌 신호 처리
- 영상처리
- 뇌 신호 처리
By Keen Dev on March 18, 2017.
Exported from Medium on May 31, 2017.