[코드스테이츠] AI부트캠프2기/Section 22 [Section 2] 2. 트리계열 모델과 분류(feat. 코드스테이츠) Tree-Based Model(2021/4/12 ~ 4/16) 이번주의 주제는 '트리계열 모델을 통한 분류방법'이다. 간단한 Decision Tree부터 앙상블 기법 그리고 하이퍼파라미터 튜닝을 통한 최적화까지 다루었다. 배웠던내용에 대한 간단한 정리와 실용적으로 유용하게 쓰일만한 꿀팁들을 위주로 적겠다. 의사결정나무(Decision Tree) 트리계열 모델에서 가장 기본모델이며 앙상블기법에서는 약학습기(Weak Learner)로 쓰인다. 결정나무의 구성요소는 다음과 같다. 구성요소 설명 부모마디 (Parent Node) 상위마디 자식마디 (Child Node) 부모마디로 부터 분리된 2개이상의 마디들 뿌리마디 (Root Node) 최상위 마디 (시작점) 끝마디 (Terminal Node) 잎(Leaf).. 2021. 4. 16. [Section 2] 1. 단순선형회귀 (feat. 코드스테이츠) [AI 부트캠프 2기] Simple Regression (2021/4/5) 기본선형회귀와 다중선형회귀에 대해서 기초적인부분을 다루었다. 내용중 핵심이 되는 기본 가설, OLS, 성능지표, 정규화의 중요성에 대해서 정리하자. 회귀분석의 가설 1. 선형성(Linearity) X와 Y는 선형적 관계를 가져야 함 2. 독립성(Independency) 각 잔차들은 독립성이 확보되어야 한다. 독립변수와 잔차는 상관관계가 없다. 3. 정규성(Normality) 변수와 잔차는 정규성을 가져야 함 잔차는 평균 = 0, 분산 = σ2를 따라야 함 4. 등분산성(Homoscedasticity) 잔차들의 분산은 같아야 함 가설들 중 하나라도 만족하지 못하면 모델성능에 제약적인 부분이 발생한다. OLS(Ordinary Leas.. 2021. 4. 5. 이전 1 다음