# 트리 모델

# Bagging & Boosting

Random forest = Bagging

디시전 트리를 여러개 이용하여 모델을 만드는 방법

둘에 차이는 train 데이터를 어떻게 다루는지에 대한 차이가 있다.

# Bagging

ats

Bagging = Booststrap + Aggregation

Booststrap:

  • Decision Tree

20고개를 한다고 생각하면 좋다

기준에 따라서 모델을 구분하는 모델

  • Bagging

병렬 모델 / 다양한 Tree 생성

alt text

흰색은 무시

잘 맞추지 못한 데이터에 웨잇을 부여하여

다음 트리에 영향을 준다

# Boosting

순차적 모델 / 정밀한 Tree 생성

LightGBM / XGBoost / CatBoost

alt text

트리가 성장하는 모습을 제안하여 한쪽으로 더욱 성장하도록 하는 방법이 있고 없고에 차이

# Hyper-parameter

사용하는 feature를 랜덤하게 선택하여 데이터가 오버피팅 되는것을 방지한다

alt text

이를 row를 기준으로 할 수 도 있다

alt text

이렇게 셈플링을 진행하여 새로운 트리를 연속하여 만들 수 있다.

각종 파라미터를 조절할 수 있다.

alt text

© Devlog from jeong