AutoML이란?
- Machine Learning을 서비스에 적용하는 데에는 여러 절차가 필요한데, 이 절차들을 단순화된 툴 또는 서비스로 제공하는 개념을 AutoML이라고 한다.
- 유저는 데이터셋을 준비해서 input으로 넣으면, 중간에 data pre-processing, feature engineering, model selection, hyperparameter tuning을 AutoML에서 책임지고 output으로 모델을 제공한다. 따라서 ML Engineering의 전문 지식이 없는 유저들도 ML 모델을 활용한 서비스 배포까지 가능하다.
- ChatGPT: What is AutoML?
PyCaret
- 공식 홈페이지: https://pycaret.org/
- PyCaret은 최소한의 코드로 end-to-end ML workflow를 제공하는 오픈소스 라이브러리이다.
- 본 실습에서는 PyCaret을 활용해 앞에서 수집한 데이터를 학습시킨 ML model을 만들고, 이를 배포까지 진행한다.
- 모델 배포란?
실습
1. Data Pre-processing
- s3에 적재되고 있는 데이터를 불러온다
- 15분후를 예측하는 모델을 만들기 위해, target을 15분후로 둔다
- open, high, low, close, volume마다 절대값이 다르기 때문에 normalize 한다
- code