본문 바로가기
기획자 댜니의 뒤처지지 않기/데이터 과학

머신러닝야학. 머신러닝1 3일차: 데이터와 변수

by 알 수 없는 사용자 2021. 1. 6.
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

3일차 학습 기록입니다. 항상 아침 일찍 일어나 강의를 들었는데, 오늘은 저녁에 들었네요. 강사님이 계속 심리적으로 힘들면 중단하는 것을 강조하는데.. 과연 저는 어떤 느낌을 받게 되련지 앞으로의 강의가 궁금해 집니다.

머신러닝야학 3일차

 

머신러닝 야학에 관심이 있으신 분들은 아래 머신러닝 야학 사이트에서 자세한 학습방법을 알 수 있습니다.

ml.yah.ac


머신러닝야학. 머신러닝1 3일차 학습 기록

직업의 시작

데이터 산업

-데이터 과학: 데이터를 만들고 만들어진 데이터를 이용하는 일 / 데이터 자체를 다룬다.

-데이터 공학: 데이터를 다루는 도구를 만들고 관리하는 일 / 데이터 다루는 것을 도와준다.


 

 데이터 산업에서의 행과 열 표현

  • 행(row)
    • 개체(instance)
    • 관측치(observed value)
    • 기록(record)
    • 사례(example)
    • 경우(case)

 

  • 열(column)
    • 특성(feature)
    • 속성(attribute)
    • 변수(variable)
    • field

독립변수와 종속변수

변수

변수 variable: 변할 수 있는, 표에서는 열

독립변수: 원인이 된는 열 (원인은 결과와 상관없이 일어나는 사건, 원인은 독립적)

종속변수: 원인으로 인해 결과가 되는 열 (결과는 원인에 종속되어서 발생하는 사건, 결과는 원인에 종속적)

 

상관관계

한쪽 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다면 서로 '상관관계'

 

인과관계

각 열이 원인과 결과의 관계일 때 '인과관계'

 

모든 인과관계는 상관관계, 하지만 모든 상관관계가 인과관계인 것은 아님

 독립변수와 종속변수의 관계를 인과관계라고 한다.

 인과관계는 상관관계에 포함된다.

 


 

심리전

앞으로의 수업에 지루함이 느껴지면 일단 중단하고, 흥미를 충전하여 다시 도전

댓글