Guts !!

[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 47회차 미션 본문

FastCampus[직장인] 위한 파이썬(미션)

[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 47회차 미션

버블스텝 2020. 12. 4. 23:06

[ 파이썬 의 필수 스킬 - 머신러닝 ] - 종합 정리 (1)

- 머신러닝의 정의 및 용어 

- 가설함수, 비용, 손실 함수 (Hypothesis, Cost, Loss Function) 
- scikit-learn 이란? 


오늘 부터 남은 기간 까지 머신러닝에 대한 강좌를 종합적으로 정리하는 시간을 갖겠습니다. 
강사님께서 중요하다고 했던 부분들 체크하고 가겠습니다. 

 

 

[ 정의 및 용어 ]

 

인공지능 : 가장 큰 개념 사람의 지능을 모방한 것, 복잡한 일을 할 수 있께 기계를 만든 것 

머신러닝 : 기본적으로 알고리즘을 이용해 데이터를 분석 및 학습하여 학습한 내용을 기반으로 판단 및 예측

딥러닝 :  인공신경망에서 발전한 형태의 인공지능.  즉, 머신러닝의 한 부분

 

 

데이터를 기반으로 패턴을 학습하여 결과를 추론 하는 것 

 

지도학습  :  Data 가 있고 Lable 이 지급되면 알맞는 모델을 학습하는 방법   ex) Regression // Classification

비지도학습  : Data 가 있지만 Lable은 지급 되지 않았기에 Lable을 찾아내는 방법  ex) Clustering // DR(차원축소)

 

머신러닝은 데이터 의존성이 크기 때문에 좋은 데이터를 얻는 것이 중요하다.  

또한 과적합을 하게 되면 반대로  일반화 오류에 빠질 수 있다. 

 

 


[ 가설함수, 비용,  손실함수 ]

 

ex)   H(x) = W*x + b    예측할 때  가설함수식을 완성하기 위해서는  W와 b를  맞추려는 것이 문제이다. 

ex) H(x)라는 가설함수가 있을 때 Ypredict 는 손실 YPredict -Y가 된다는 것을 볼 수 있고

    손실 함수 = W*X+b -Y가 되는 것이다. 

 

손실 함수의 합이 0으로 수렴하는 것이 최적의 해라고 할 수 있는데 문제는 Loss -1, 0 , 1이 모두 합을 하면 0 이 된다는것이다.  오류를 실행하는 것. 

 

 

위와 같이 손실함수의 합을 구하게 되었는데 문제는 데이터의 개수가 많아 지면 손실이 커지므로 전체 손실의 평균을 구하는 것이다. 최종적인 MSE 는 

이와 같은 식으로 수렴 한다는 것이다.  데이터의 개수가 많아지면 손실이 커지므로 전체 손실의 평균을 구하게 되는 것입니다.

 


 

[ scikit-learn ]

 

사이킷 런 은 파이썬에서 머신러닝을 하기 위해서 꼭 필요한 라이브러리임. 각각의 머신러닝을 위한 모델들이 존재   

 

from sklearn.linear_model import LinearRegression

model = LinearRegression() 

model.fit(x,y) 

prediction = model.predict() 

 

위와 같은 방식으로 진행을 될 것입니다.  모델 선언 --> fit 훈련 시키기 -->  predict() 예측하기 ! 이 순서입니다. 

 

예제1)  

순서는 역시 위와 동일 한 순서로 진행되는 것을 볼 수 있다.

 


오늘의 포스팅은 여기까지입니다.  머신러닝에 대한 강의를 종합적으로 하는 포스팅을 다음에도 진행하겠습니다. 

 

해당 강의 이미지 링크

https://bit.ly/3havsav