본문 바로가기
기획자 댜니의 뒤처지지 않기/데이터 과학

머신러닝야학. 머신러닝1 4, 5일차: 머신러닝의 분류

by 알 수 없는 사용자 2021. 1. 8.
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

본격적인 머신러닝 공부입니다! 4,5일차를 묶은 이유는 머신러닝 분류라는 공통 주제를 갖고 있기에 함께 정리 하였습니다. 책으로 배울땐 너무 어렵게 여겨졌었는데 정말 이해하기 쉽게 가르쳐주네요.(역시 생활코딩) 강화학습에서 게임을 예시로 두는데 이해가 쏙쏙 되었습니다. 

머신러닝야학 4일차

 

머신러닝 야학에 관심이 있으신 분들은 아래 머신러닝 야학 사이트에서 자세한 학습방법을 알 수 있습니다.

ml.yah.ac


머신러닝야학. 머신러닝1 4일차 학습 기록

머신러닝의 분류

기계학습

  • 지도학습:기계를 가르친다,컴퓨터를 학습시켜서 모델을 만드는 방식
    • 분류
    • 회귀 
  • 비지도학습:지도학습에 포함되지 않는 방법, 데이터의 성격을 파악하거나 데이터를 잘 정리정돈 하는 것에 사용
    • 군집화
    • 변환
    • 연관
  • 강화학습: 학습을 통해서 능력을 향상시킨다는 점에서 지도학습이랑 비슷, 더 좋은 답을 찾아가는 것

 

지도학습

과거의 데이터로부터 학습해서 결과를 예측하는 데에 주로 사용

머신러닝의 지도학습을 이용하기 위해선 많은 데이터를 수집해야 한다

데이터는 독립변수(원인)와 종속변수(결과)로 이루어져 있어야 한다

 이를 이용해서 컴퓨터가 관계를 설명할 수 있는 공식 '모델'을 만든다

 


 

회귀 VS 분류

회귀

예측하고 싶은 종속변수가 숫자(양적 데이터)일 때 회귀 사용

ex. 학생들의 나이에 따른 를 기록한다

공부시간에 따른 점수를 확인한다

 

분류

문제에서 추측하고 싶은 결과가 이름 혹은 문자(범주형 데이터)일 때 분류를 사용

ex. 공부시간에 따른 최종 합격여부를 확인한다

소고기의 정보를 토대로 등급을 측정한다

 


 

비지도 학습

비지도학습의 사례로는 '군집화'와 '연관규칙'이 있다

군집화

군집화(클러스터링): 비슷한 것들을 찾아서 그룹을 만드는 것 , 어떤 대상을 구분해서 그룹을 만드는 것, 비슷한 행을 그룹핑하는 것

(분류: 어떤 대상이 어떤 그룹에 속하는지를 판단하는 것)

 

연관규칙학습

장바구니학습

연관성을 파악하여 연관규칙을 이용한 것 (ex. 쇼핑 추천, 음악 추천, 영화 추천, 검색어 추천, 동영상 추천)

연관규칙: 서로 관련이 있는 특성(열)을 찾아주는 머신러닝의 기법

 

관측치(행)를 그룹핑 해주는 것 군집화

특성(열)을 그룹핑 해주는 것 연관규칙

 

 

비지도 학습 정리

비지도 학습: 탐함적, 데이터들의 성격을 파악하는 것이 목적 (그저 데이터만 있으면 됨)

 데이터를 정리 정돈해서 그 표에 담긴 데이터의 성격을 파악하는 것이 중요한 목적

 


 

강화학습

강화학습: 일단 해보는 것(지도학습이 '배움'이라면 강화학습은 '경험')

  • 게임 환경(environment)
  • 게이머 에이전트(agent)
  • 게임화면 상태(state)
  • 게이머의 조작 행동(action)
  • 상과 벌 보상(reward)
  • 게이머의 판단력 정책(policy)

 

더 많은 보상을 받을 수 있는 정책을 만드는 것

스스로 수련을 통해서 더 좋은 선택을 하는 기능

(ex. 알파고)

댓글