'혼공스터디' 태그의 글 목록

혼공스터디

[혼공머신] 4주차 - CH05. 트리 알고리즘 2024.07.30
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 2024.07.22
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 2024.07.14

[혼공머신] 4주차 - CH05. 트리 알고리즘

2024. 7. 30. 01:14

가족 여행 및 대학원 MT로 인해... 엄청난 지각 공부를 한다.

미리 하지 못했음에 대해 반성 !!!! 무릎 꿇고 반성 !!!

05-1 결정 트리 (Decision Tree)

- 로지스틱 회귀 (Logistic Regression)

- 결정 트리 (Decision Tree Classifier), 가지 치기(Prunning)

05-2 교차 검증과 그리드 서치

- 검증 세트 (validation)

- 교차 검증 (Cross Validation)

. 분할기(Splitter)를 사용한 교차 검증 : StratifiedKFold

- 하이퍼파라미터 튜닝 (Hyperparameter Optimization)

. 그리드 서치 (GridSearchCV)

. 확률 분포 선택 : uniform, randint

. 랜덤 서치 (RandomizedSearchCV)

05-3 트리의 앙상블 (Ensemble)

- 정형 데이터와 비정형 데이터

. 텍스트/오디오/이미지/영상 등의 비정형 데이터는 주로 DL 에서 취급

- 랜덤 포레스트 (RandomForest)

- 엑스트라 트리 (ExtraTrees)

- 그래디언트 부스팅 (Gradient Boosting)

- 히스토그램 기반 그래디언트 부스팅 (Histogram Gradient Boosting)

- XGBoost vs LightGBM

기본 숙제 : 교차 검증을 그림으로 설명하기

추가 숙제 : 앙상블 모델 손 코딩

- 전체를 캡처하는 것은 무의미한 것 같아, 하단부 부분만 캡처 !!!

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 6주차 - CH.07 딥러닝을 시작합니다 (3)	2024.08.25
[혼공머신] 5주차 - CH.06 비지도 학습 (0)	2024.08.16
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 (0)	2024.07.22
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07

[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘

2024. 7. 22. 03:07

어느덧 벌써 4장을 공부하고 있는 3주차가 되었다.

만날 일요일 밤에 벼락치기하고 있는 불량한 참가자 신세이지만....

이렇게라도 공부하려하는 스스로를 기특해 해야지 !!!!! 쓰담~ 쓰담~

04-1 로지스틱 회귀 (Logistic Regression)

- 분류 (Classifier) 모델

- vs. KNeighborClassifier

- 이진 분류 : 시그모이드(Sigmoid)

- 다중 분류 : 소프트맥스(Softmax), parameter C

04-2 확률적 경사 하강법 (Stochastic Gradient Descent)

- 점진적 학습 → 확률적 경사 하강법

- 손실함수 (loss function)

- 로지스틱 손실 함수 (logistic loss function, Binary Cross-Entropy loss function)

- partial_fit()

가제트 형사를 그려주신 것 같은데... MZ(GenZ?) 분들은 아시려나!? ㅋㅋㅋ

Homework

[기본 숙제]

- ① 시그모이드 함수(Sigmoid Function)

→ 기본적으로 선형 함수만 사용하는 경우 결과값이 너무 커지거나 너무 작아질 수 있으므로

비선형 함수를 이용하여 값을 수렴하게 만드는 것이 계산하기에 용이해진다.

이 때, 로지스틱 회귀에서 이진 분류를 사용하는 경우 시그모이드 함수를 이용하면

0에서 1사이의 값으로 변환이 되며, 0.5를 기준으로 0과 1로 결과를 판단하기에 적합하다.

[추가 숙제]

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 5주차 - CH.06 비지도 학습 (0)	2024.08.16
[혼공머신] 4주차 - CH05. 트리 알고리즘 (0)	2024.07.30
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 (0)	2024.07.07

[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제

2024. 7. 14. 23:55

고작 2주차인데, 뭔가 많다!

그런데, 여기서 끝이 아니라 뒤에 좀 더 있다!!!

다시 한 번 느꼈지만, 이 책은 절대 초보자를 위한 책이 아니다 !!!

03-1. K-최근접 이웃 회귀 (K-NN Regression)

- n_neighbors 파라미터를 이용하여 최근접 이웃과의 거리 평균을 이용하여 회귀

- 과대적합 vs. 과소적합

- n_neighbors 값 변경을 통해 과대적합, 과소적합 이슈 해결

03-2. 선형 회귀 (Linear Regression)

- coef_, intercept_

- 과대/과소 적합 이슈 → 다항 회귀

03-3. 특성공학과 규제

- 다항 특성 만들기 : PolynomialFeatures

- 규제 전에 표준화 : StadardScaler

- Ridge & Lasso

기본 숙제

동영상 강의에 얼추 나와있는 내용이라 어렵지 않다 ^^

n_neioghbors 값을 바꿔가면서 예측하고, 이것을 그래프로 표현하면 된다.

눈으로 봐도 얼추 5값이 적당하지 싶다~

추가 숙제

[ 모델 파라미터에 대해 설명하기 ]

파라미터는 머신러닝 및 딥러닝 모델의 핵심 요소로써,

모델이 데이터를 통해 학습하고 예측을 수행하는 데 필요한 내부 변수들을 의미한다.

이 값들을 적절히 조정하게 되면 모델은 주어진 문제를 효과적으로 해결할 수 있게 된다.

K-최근접 이웃 회귀(K-NN Regression) 챕터에서 n_neighbors 값을 조정하면서

과대적합이나 과소적합 문제를 완화하는 과정을 앞에서 살펴보았는데

여기에서 n_neighbors가 바로 모델 파라미터 중 하나이다.

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 4주차 - CH05. 트리 알고리즘 (0)	2024.07.30
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 (0)	2024.07.22
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 (0)	2024.07.07
[혼공데분] 6주차_복잡한 데이터 표현하기 (0)	2024.02.09

PREV 1 NEXT

머가필요해