LG AI(AImiers) 과정(7)
-
기록_2
정형데이터 대회는 AutoML에 때려박고(?) 시작하자! 이번 코드에서는 AutoML 패키지인 PyCaret을 활용하여 정형데이터 대회에 참여하는 과정을 알아보겠습니다. Feature engineering, model tuning 없이 주어진 데이터를 그대로 활용하여 default 모델을 훈련하고 예측 했으므로, 추가 작업을 통해 높은 성능을 보여줄 수 있을 것 같습니다. 개인적으로 PyCaret은 아직까지 single output인 문제에는 적합한데 multi output 문제에는 부적합한것 같습니다. 혹시 multi output 문제에도 잘 적용된다면 알려주세요! In this kernel we will use an AutoML package called PyCaret to enter data sci..
2023.02.17 -
LG AImeris_DACON_Competition_note
1. train, test data describe 2. Data preprocessing - Nan value 처리 : 1) 결측치 15% 이상인 열 제거 2) train data의 경우 Y_Class group >> Line, Product ID group >> 그룹별 중간값 적용 3) test data 경우 LIne group > Product ID group 후 그룹 중간값 적용 - 정규화 방안 3. Model development 3-1 . Line 별로 Y_Quality 예측 train data features : "x_000" train data target : "Y_Quality" train data로 학습 후 test data 의 "x_000"(train data features)를 이용..
2023.02.12 -
Casual Effect Identifiability
Casual Effect Identifiability 이번 장에서는 인과효과를 계산하는 방법에 대해 알아본다. - 위의 3가지를 이용하여 인과추론 알고리즘을 통해 계산을 진행 계산이라고 말은 했지만, 특정할 수 있는지를 물어보는 것이고, 실제로 가능하다면 인과효과를 계산할 수 있을 것이고, 특정할 수 없다면 계산할 수 없다는 것이 아니라, 주어진 그래프와 데이터가 있을 때 그래프에 호환이 되는 2가지의 다른 모델에서 정의되고 있는 인과효과가 달라 이 값은 특정할 수 없다라고 판단 예를 들어 인과효과를 계산한다 왼쪽에는 주어진 그래프에는 Z, X, W, Y 변수가 있고 X에 중재를 하려고 할 때, Z 변수는 X와 Y에 서로 영향을 미치는 교란 변수, W 변수는 X와 Y 중간에 있는 변수 (mediator)..
2023.01.26 -
Time-SeriesTransformer (TST)
보호되어 있는 글입니다.
2023.01.24 -
[part6. ensemble]
[앙상블] - 앙상블 방식 : 머신러닝 에서 알고리즘 종류에 상관없이 서로 다르거나, 같은 매커니즘으로 동작하는 다양한 머신러닝 모델을 묶어 함께 ㅅ용하는 방식 * 장점 : 예측 성능 안정적으로 제공, 쉽게 구현힐 수 있음 * 단점 : 다양한 모델을 사용하기 때문에 이 모델 자체로는 compact한 표현이 되기는 어려운 문제가 있음 - Bagging, Boosting *bagging : 학습과정에서 training sample을 랜덤하게 나누어 선택해 학습 *boosting : classifier순차적으로 적용, 이전 calssifier를 다음 분류기에서 보완하는 방식 - Model 평가 방법 1. accuracy : 정확도 2. confusion matrix : 각 경우에 대해 오차가 얼마나 있었는지 ..
2023.01.14 -
part2. linear regression 2023.01.06