머신러닝 기초
파이썬 텐서플로우 및 머신러닝
- https://www.youtube.com/watch?v=YK9PNTJ_aFA 머신러닝 내용 정리
파이썬 설치
- 구글에 python release for windows 검색
- 3.6.2버전 x86-64 executable 다운받고 Add Python 3.6 to PATH 체크해서 Path에 파이썬 추가
- 명령 프롬프트 열고 pip3 install tensorflow
- 아래 에러 발생 시 python -m을 붙인 명령어 실행
- No module named pip3 라는 에러가 뜨면 pip 사용
Fatal error in launcher: Unable to create process using '"c:\users\wori\appdata\local\programs\python\python37-32\python.exe" "C:\Users\wori\AppData\Local\Programs\Python\Python37-32\Scripts\pip3.exe" install tensorflow'
- python idle로 들어가서 메뉴에서 file-new 선택
- hello world 출력. 메뉴에서 Run-Run Module
import tensorflow as tf
hello = tf.constant('Hello World!')
sess = tf.Session()
print(sess.run(hello))
- 출력 결과. b는 byte 문자형이라는 뜻
b'Hello World!'
선형 회귀
- 변수 사이의 선형적인 관계(직선적)를 모델링한 것
- 일을 할 수록 매출이 올라간다. 그래프를 그려보면 직선이다. 이것을 직선적인 관계라고 한다, 일상에 많은 현상들이 선형적
- 이러한 선형적인 관계에 적용하는 대표적인 기계 학습 이론이 선형 회귀
- 학습을 시킨다 => 주어진 데이터를 학습시켜서 가장 합리적인 ‘직선’을 찾아낸 것. 데이터 3개 이상일 때 의미가 있음
- H(x) = Wx + b
- 하나의 일차 방정식을 이용해 직선을 표현.(W는 기울기 b는 절편)
- 가설을 수정해 나가면서 ‘그나마’ 가장 합리적인 식을 찾아냄
- 즉 선형 회귀란 주어진 데이터를 이용해 일차 방정식을 수정해 나가는 것
비용
- 가설이 얼마나 정확한 지 판단하는 기준
- 비용 함수 (예측 값 - 실제 값)2의 평균
- 현재의 W, b 값과 데이터를 이용하면 비용 함수를 구할 수 있음. 비용이 적을 수록 좋다.(음수값 x)
경사하강
- 경사 하강을 이용해 합리적인 식을 도출
- H(x) = Wx
- 비용 함수는 (Wx - y)2
- 그래프를 그려보면 경사를 타고 내려갔다가 다시 올라가는 곡선이 그려짐. x축을 W라고 생각하면 됨
- 미분은 기울기를 구하기 위해 사용하는 개념. 수평일수록 좋은 식
- 텐서플로우는 경사 하강 라이브러리 제공